编辑推荐
这《机器视觉》是计算机视觉的“圣经”!如果任何人想要学习计算机视觉的基本内容,一定要以这《机器视觉》作为起始点。千万不要错过!尤其是,这本经典著作对于书中概念的杰出的介绍方法。我强烈地将这本不可或缺的书推荐给所有学习计算机视觉的人。
内容简介
《机器视觉》从逆问题的角度出发,提出了一整套关于机器视觉的研究方法,其核心是:机器视觉应该基于对成像过程的深刻理解!作为作者在麻省理工学院(MIT)所讲授的机器视觉课程的指定教材,《机器视觉》已经被使用了近30年,至今仍被欧美许多著名高校所广泛使用。《机器视觉》提供了一个理解现有方法和技术以及为以后的研究做准备的系统框架,其中包含了很多将机器视觉方法应用于实际问题的内容。《机器视觉》共包括18章,前13章主要讲述早期视觉的内容,后5章更加关注于:解决一些更加复杂的实际问题。最后,作者将各个章节所介绍的方法整合到一起,搭建了一个可以和周围环境进行交互的“眼-手”系统。书中所用到的数学方法,也都收录在最后的附录中;作为内容的补充和扩展,《机器视觉》还提供了丰富的练习题。
《机器视觉》可以作为高等院校相关专业本科生和研究生一年级课程的教材,也可以作为研究人员的参考书籍。
作者简介
伯特霍尔德·霍恩(BertholdKlausPaulHorn)现为美国麻省理工学院(MIT)计算机与电子工程系(EECS)人工智能实验室(CSAIL)的教授、美国工程院(NAE)院士、美国人工智能协会(AAAI)院士,是享有国际声望的计算机视觉领域专家。他从事计算机视觉领域的研究长达40多年,在该领域有许多开创性和奠基性的贡献,其博士论文《ShapefromShading》开创了一个崭新的研究领域。他提出的经典光流算法(Horn-Schunck方法)奠定了光流及运动视觉研究的基础。霍恩教授的很多研究成果,如:二维retinex算法、反射图、扩展Gauss图、无源导航等,都在计算机视觉领域和工业界发挥着巨大的作用。他所开创的基于逆问题理论、通过分析成像过程来研究机器视觉的方法,被称为霍恩学派。
霍恩教授获得了诸多奖项和荣誉,其中包括:
Rank奖:“为了表彰其在引领视觉系统实用化的工作中所做出的开创性贡献。”
——Rank基金委员会。1989年9月。
入选美国人工智能协会:“由于其在人工智能领域中所做出的巨大贡献。”——美国人工智能协会。1990年8月。
入选美国工程院:“为其在计算机视觉领域(特别是在:通过图像亮度来恢复三维几何结构的研究中)所做出的开创性贡献。”——美国工程院。2002年2月。
AzrielRosenfeld终身成就奖:“为表彰其在早期视觉(包括:光流、从明暗恢复形状)中所做出的奠基性贡献。”——IEEE计算机协会。2009年9月。
精彩书评
《机器视觉》这《机器视觉》提出了一种从成像到图像分析、再到场景分析的一致研究方法。它既可以作为视觉领域中“Horn学派”的个人思想表现,也可以作为一本教科书。每一个从事计算机视觉相关领域研究的科学家和技术人员,都应该认真地阅读《机器视觉》!
——AlanK.Mackworth教授,美国哥伦比亚大学
霍恩教授是一个在人类以及机器视觉领域做了很多年研究的资深研究者。他所写的这本优秀教材非常适合觉领域的工程师、教师以及科学家。《机器视觉》遵循严格的数学架构,开始于成像的物理模型;逐渐过渡到——人类和机器对于光照、形状、运动和景深的感知方面的新计算理论;最后结束于——机器视觉方法在自动导航和工业机器人中的现实应用。
——AIBovik教授,美国田纳西大学
《机器视觉》是一部极好的书,既是对该领域很好的介绍,同时也是一本完整包含了计算机视觉所需的数学知识的入门书籍。
——CharlesThorpe,《美国科学家》
当我首次拿起这《机器视觉》时,我有点担心这《机器视觉》出版年代的久远,但是,这《机器视觉》是机器视觉核心思想的一个极其丰富的展现!我强烈地推荐:将这《机器视觉》作为一本教科书。每一位认真从事于计算机视觉、机器人或计算机图形学领域的研究者,都应该拥有这《机器视觉》。我认为这《机器视觉》写得太好了,不管是过去还是未来,它都会是很有用的。
——读者评论,Amazon网站
目录
第1章简介
1.1机器视觉
1.2机器视觉的任务
1.3机器视觉和其他领域的关系
1.4后续章节的概要
1.5本章参考文献
1.6习题
第2章成像与图像检测
2.1成像的两个方面
2.1.1透视投影
2.1.2正射投影
2.2亮度
2.3透镜
2.4我们的视觉世界
2.5图像检测
2.5.1感知颜色
2.5.2随机性和噪声
2.5.3图像量化
2.6本章参考文献
2.7习题
第3章二值图:几何性质
3.1二值图
3.2简单几何性质
3.2.1区域的位置
3.2.2朝向
3.3投影
3.4离散二值图
3.5行程编码
3.6本章参考文献
3.7习题
第4章二值图:拓扑性质
4.1多个物体
4.1.1标注图像中的物体
4.1.2连通性
4.1.3串行标注算法
4.2局部计数和迭代修正
4.2.1局部计数
4.2.2集合可加性
4.2.3迭代修正
4.3本章参考文献
4.4习题
第5章区域与图像分割
5.1设定阈值的方法
5.2统计直方图
5.3空间相关性
5.4图像分割
5.5使用颜色信息
5.6合并与分裂
5.7本章参考文献
5.8习题
第6章图像处理:连续图像
6.1线性移不变系统
6.2卷积与点扩散函数
6.3调制传递函数
6.4Fourier变换和滤波
6.5Fourier变换和卷积
6.6广义函数与单位冲击函数
6.7收敛因子与单位冲击函数
6.8偏微分与卷积
6.9旋转对称与各向同性算子
6.10模糊,失焦和运动拖尾
6.11图像复原与增强
6.12相关以及功率谱
6.13最优滤波器与噪声抑制
6.14图像模型
6.15本章参考文献
6.16习题
第7章图像处理:离散图像
7.1有限的图像尺寸
7.2离散图像采样
7.3采样定理
7.4离散Fourier变换
7.5循环卷积
7.6一些有用的结果
7.7本章参考文献
7.8习题
第8章边缘和边缘查找
8.1图像中的边缘
8.2微分算子
8.3离散近似
8.4局部算子和噪声
8.5边缘的检测和定位
8.6结论和例子
8.7本章参考文献
8.8习题
第9章光照与颜色
9.1物体表面的反射率以及Land实验
9.2Mondrian图
9.3复原光照
9.4求解逆问题
9.5光照的归一化
9.6选择阈值
9.7离散情况下计算光照
9.8一个物理模型
9.9本章参考文献
9.10习题
第10章反射图:光度立体视觉
10.1图像亮度
10.2辐射
10.3图像的形成
10.4双向反射分布函数
10.5连续光源
10.6物体表面的反射性质
10.7物体表面的亮度
10.8物体表面的朝向
10.9反射图
10.10图像中的明暗
10.11明暗图
10.12光度立体视觉
10.13估计反射率
10.14曲面朝向的查询表
10.15本章参考文献
10.16习题
第11章从明暗恢复形状
11.1从明暗中恢复形状
11.2特征曲线与初始曲线
11.3奇异点
11.4奇异点附近的幂级数
11.5闭合边界
11.6球极投影
11.7松弛方法
11.8从针状图中恢复景深
11.9本章参考文献
11.10习题
第12章运动场和光流
12.1运动场
12.2光流
12.3光流的光滑性
12.4填充光流信息
12.5边界条件
12.6离散情况
12.7光流的不连续
12.8本章参考文献
12.9习题
第13章摄影测量和立体视觉
13.1两张图像之间的差异
13.2摄影测量
13.3绝对朝向
13.4相对朝向
13.5使用已知的相对朝向
13.6计算景深
13.7外部朝向
13.8内部朝向
13.9寻找共轭点对
13.10本章参考文献
13.11习题
第14章模式分类
14.1由一个例子引入
14.2特征向量
14.3基本方法
14.4最近邻分类
14.5最近中心分类
14.6实例:白血球分类
14.7使用概率密度模型设计分类方法
14.8不同形状的聚类
14.9聚类的自动形成
14.10一个童话
14.11本章参考文献
14.12习题
第15章多面体物体
15.1多面体场景的素描图
15.2恢复三维结构
15.3梯度空间
15.4明暗和梯度空间
15.5图像分割与多个物体的情况
15.6标记素描图
15.7演示:复制一个积木结构
15.8本章参考文献
15.9习题
第16章扩展Gauss图
16.1凸多面体
16.2Gauss图
16.3Gauss曲率
16.4扩展Gauss图
16.5扩展Gauss图的例子
16.6离散情况
16.7圆环面的扩展Gauss图
16.8对单位球面的剖分
16.9旋转体的扩展Gauss图
16.10一般情况下的Gauss曲率
16.11扩展Gauss图的应用
16.12本章参考文献
16.13习题
第17章无源导航
17.1恢复观测者的运动
17.2预备知识和技术
17.3平动的情况
17.4使用其他的范数形式
17.5转动的情况
17.6一般刚体运动的情况
17.7本章参考文献
17.8习题
第18章从容器中抓取零件
18.1方法总览
18.2动机
18.3装着零件的容器
18.4图像分割
18.5典型物体模型
18.6物体表面的透视收缩
18.7对齐主轴
18.8非凸的物体
18.9物体在空间中的姿态
18.10旋转的表示方法
18.11朝向统计直方图的匹配
18.12针状图的二次投影
18.13对偏离理想情况的矫正
18.14选择要抓取的物体
18.15移动机器臂
18.16“眼---手”坐标系之间的变换
18.17任意形状的物体
18.18结论
18.19结束语
18.20本章参考文献
18.21习题
附录:一些有用的数学工具
A.1求解三角形
A.2向量操作
A.3向量和矩阵的导数
A.4线性方程组的最小二乘解
A.5Lagrange乘子
A.6变分法
A.7本附录参考文献
参考文献
索引
精彩书摘
4.1.2连通性 首先,我们必须认真考虑:术语近邻点(具体)意思。假设我们使用正方形作为基本单元来对图像进行剖分,那么,在这种情况下,我们可以粗略地将近邻点“认为是”:和给定图像单元(即:像素点)的四条边相连接的四个图像单元。但是,我们应该如何看待:和给定像素点的四个角相连的四个像素点呢?因此,对近邻点的定义存在两种可能的情况,也就是说, 4—连接:只有和给定图像单元(即:像素点)的(4条)边相连的(4个)像素点,才被认为是(给定像素点)的近邻点。 8—连接:和给定图像单元的(4个)角相连的(4个)像素点,也被认为是(给定像素点)的近邻点。 这两种不同的定义方式如下图所示: 事实上,这两种定义方式都不能完全令人满意。要看出这一点,我们需要明确的一点是:从背景中,我们也可以“分割出”一个连通区域。我们希望:对于离散二值图,我们从连续二值图中得出的、关于连通区域的直观感觉仍然适用。例如,我们可以用一条简单的闭合曲线,将图像分割为两个简单的连通区域(如图4.2所不)。这个结论被称为Jordan曲线定理。 ……前言/序言
中文版序言
对于《RobotVision》中译本的出版发行,我感到非常兴奋。因为这将使得广大的学生、教师和科研人员可以更容易地接触和了解机器视觉。自从《RobotVision》首次出版以来,将近三十年过去了,机器视觉领域一直在不断地发展和变化着,但是直到现在,始终存在着一种需要,即:寻找一种关于这个领域的统一的研究方法,并且,该方法应该是能够经受住时间考验的。我相信在研究机器视觉的过程中,我们应该思索如下两个问题:1)成像过程的基本原理是什么?2)如何探索对成像过程“求逆”(也就是说,就是从一张图像、多张图像或者图像序列中恢复出关于场景或者观测者的信息)的知识和方法?显然,要做到这一点,我们至少需要理解:光学、运动学和坐标变换。
通过物理模型,我们可以很自然地导出相应的数学公式,然后,通过数学公式,我们可以导出相应的算法。《机器视觉》的主题包括:
建立起对成像过程的基本理解;
探讨对成像过程进行求逆的方法。
尽管《机器视觉》包含了许多用于解决机器视觉问题的具体方法,但是,《机器视觉》所关注的是:建立一种针对不同机器视觉问题的整体解决方法。事实上,许多成功的机器视觉技术,例如:从明暗恢复形状、光流、无源导航等,都是这种“整体解决方法”的具体应用。关注基本原理所带来的一个好处是:真正需要去理解的核心内容变少了,甚至连算法的实现细节都有可能会变成一个“瞬间”就被理解或完成的工作。
最近几年,在机器视觉的应用领域取得了很多实质性的进展,这些进展部分归功于机器学习方法的使用。当然,机器学习结果的好坏依赖于:从图像中所提取出来的特征的“质量”。特征的“描述力”越强,区分效果也就越好;所提取出的特征越有“特点”,所得到的结果也就越好。从这个意义上说,《机器视觉》所讲述的内容可以被看作是:用于提取“具有物理意义的特征”的方法。还记得当初在写《RobotVision》的序言时,我以“机器视觉是一个年轻的、发展很快的领域”作为开篇的第一句话。这么多年过去了,我们很高兴地看到:直到今天,这句话还像当初我写它时一样正确!
BertholdK。P。Horn
2014年6月于MIT