《OpenCV 3计算机视觉：Python语言实现（原书第2版）》

书海网短评：
OpenCV3是一种先进的计算机视觉库，它提供了很多图像和视频处理操作，以及一些代表计算机视觉未来发展方向的功能，如人脸识别或目标跟踪。学习计算机视觉算法、模型和OpenCVAPI的基本概念之后，可以开发各种现实生活中的应用

编辑推荐

OpenCV3是一种先进的计算机视觉库，它提供了很多图像和视频处理操作，以及一些代表计算机视觉未来发展方向的功能，如人脸识别或目标跟踪。学习计算机视觉算法、模型和OpenCVAPI的基本概念之后，可以开发各种现实生活中的应用程序（如安全和监控方面的应用程序）。
《OpenCV 3计算机视觉：Python语言实现（原书第2版）》从图像处理的基本操作出发，带你开启先进计算机视觉的探索之旅。计算机视觉是一个快速发展的学科，与其相关的现实应用也呈爆炸性增长，《OpenCV 3计算机视觉：Python语言实现（原书第2版）》的目的就是帮助计算机视觉领域的新手和想要了解全新的OpenCV3.0.0的计算机视觉专家快速掌握基于Python的OpenCV计算机视觉开发的实用方法、技巧和实践。

通过阅读《OpenCV 3计算机视觉：Python语言实现（原书第2版）》，你将学到:
　　安装和熟练使用基于Python的OpenCV3的API
　　掌握图像处理和视频分析的基础知识
　　在图像和视频中检测和识别目标
　　使用OpenCV检测和识别人脸
　　训练和使用自己的对象分类器
　　了解计算机视觉中的机器学习概念
　　使用OpenCV的人工神经网络来解决实际问题
　　开发现实生活中的计算机视觉应用

内容简介

OpenCV是开源、跨平台的计算机视觉库，由英特尔公司发起并参与开发，在商业和研究领域中可以免费使用。《OpenCV 3计算机视觉：Python语言实现（原书第2版）》介绍了如何通过Python来开发基于OpenCV3.0的应用。作为当前非常流行的动态语言之一，Python不仅使用非常简单，而且功能强大。通过Python来学习OpenCV框架，可以让你很快理解计算机视觉的基本概念以及重要算法。

《OpenCV 3计算机视觉：Python语言实现（原书第2版）》分9章来介绍计算机视觉的重要概念，所有的概念都融入了一些很有趣的项目。《OpenCV 3计算机视觉：Python语言实现（原书第2版）》首先详细介绍了多个平台下基于Python的OpenCV安装，继而介绍了计算机视觉应用的基本操作，包括：图像文件的读取与显示，图像处理的基本操作（比如边缘检测等），深度估计与分割，人脸检测与识别，图像的检索，目标的检测与识别，目标跟踪，神经网络的手写体识别。可以这样说，《OpenCV 3计算机视觉：Python语言实现（原书第2版）》是一本不可多得的采用OpenCV实践计算机视觉应用的好书。

作者简介

JoeMinichino　HooluxMedical计算机视觉工程师，NoSQL数据库LokiJS的开发者。他是一个充满激情的程序员，对编程语言和技术充满好奇，并不断尝试。在Hoolux，Joe领导了针对医疗行业的Android计算机视觉广告平台的开发。

JosephHowse　NummistMedia公司总裁，自2012年起，出版了多部OpenCV方面的著作，包括《OpenCVforSecretAgents》《AndroidApplicationProgrammingwithOpenCV3》和《OpenCVComputerVisionwithPython》等。

译者简介

刘波　博士，任教于重庆工商大学计算机科学与信息工程学院，主要从事机器学习理论、计算机视觉和优化技术研究，同时对Hadoop和Spark平台上的大数据分析感兴趣，也对Linux平台的编程和Oracle数据库感兴趣。

苗贝贝　硕士，北京工商大学计算机与信息工程学院研究生，主要从事机器学习理论、时间序列动力学特征分析及应用的研究，对基于Python的计算机视觉分析有浓厚的兴趣。

史斌　毕业于电子科技大学计算机学院，目前就职于成都知数科技有限公司，主要从事数据爬取、数据处理、平台运维等工作，熟悉Python、Linuxshell，同时热爱计算机视觉编程，熟悉Python下的OpenCV编程。

目　录　Contents
译者序
前言
作者简介
审校者简介
译者简介
第1章　安装OpenCV1
1.1　选择和使用合适的安装工具2
1.1.1　在Windows上安装2
1.1.2　在OSX系统中安装6
1.1.3　在Ubuntu及其衍生版本中安装11
1.1.4　在其他类Unix系统中安装12
1.2　安装Contrib模块13
1.3　运行示例13
1.4　查找文档、帮助及更新14
1.5　总结15
第2章　处理文件、摄像头和图形用户界面16
2.1　基本I/O脚本16
2.1.1　读/写图像文件16
2.1.2　图像与原始字节之间的转换19
2.1.3　使用numpy.array访问图像数据20
2.1.4　视频文件的读/写22
2.1.5　捕获摄像头的帧23
2.1.6　在窗口显示图像24
2.1.7　在窗口显示摄像头帧25
2.2　Cameo项目（人脸跟踪和图像处理）26
2.3　Cameo—面向对象的设计27
2.3.1　使用managers.CaptureManager提取视频流27
2.3.2　使用managers.WindowManager抽象窗口和键盘32
2.3.3　cameo.Cameo的强大实现33
2.4　总结34
第3章　使用OpenCV3处理图像36
3.1　不同色彩空间的转换36
3.2　傅里叶变换37
3.2.1　高通滤波器37
3.2.2　低通滤波器39
3.3　创建模块39
3.4　边缘检测40
3.5　用定制内核做卷积41
3.6　修改应用43
3.7　Canny边缘检测44
3.8　轮廓检测45
3.9　边界框、最小矩形区域和最小闭圆的轮廓46
3.10　凸轮廓与Douglas-Peucker算法48
3.11　直线和圆检测50
3.11.1　直线检测50
3.11.2　圆检测51
3.12　检测其他形状52
3.13　总结52
第4章　深度估计与分割53
4.1　创建模块53
4.2　捕获深度摄像头的帧54
4.3　从视差图得到掩模56
4.4　对复制操作执行掩模57
4.5　使用普通摄像头进行深度估计59
4.6　使用分水岭和GrabCut算法进行物体分割63
4.6.1　用GrabCut进行前景检测的例子64
4.6.2　使用分水岭算法进行图像分割66
4.7　总结69
第5章　人脸检测和识别70
5.1　Haar级联的概念70
5.2　获取Haar级联数据71
5.3　使用OpenCV进行人脸检测72
5.3.1　静态图像中的人脸检测72
5.3.2　视频中的人脸检测74
5.3.3　人脸识别76
5.4　总结82
第6章　图像检索以及基于图像描述符的搜索83
6.1　特征检测算法83
6.1.1　特征定义84
6.1.2　使用DoG和SIFT进行特征提取与描述86
6.1.3　使用快速Hessian算法和SURF来提取和检测特征89
6.1.4　基于ORB的特征检测和特征匹配91
6.1.5　ORB特征匹配93
6.1.6　K-最近邻匹配95
6.1.7　FLANN匹配96
6.1.8　FLANN的单应性匹配99
6.1.9　基于文身取证的应用程序示例102
6.2　总结105
第7章　目标检测与识别106
7.1　目标检测与识别技术106
7.1.1　HOG描述符107
7.1.2　检测人112
7.1.3　创建和训练目标检测器113
7.2　汽车检测116
7.2.1　代码的功能118
7.2.2　SVM和滑动窗口122
7.3　总结134
第8章　目标跟踪135
8.1　检测移动的目标135
8.2　背景分割器：KNN、MOG2和GMG138
8.2.1　均值漂移和CAMShift142
8.2.2　彩色直方图144
8.2.3　返回代码146
8.3　CAMShift147
8.4　卡尔曼滤波器149
8.4.1　预测和更新149
8.4.2　范例150
8.4.3　一个基于行人跟踪的例子153
8.4.4　Pedestrian类154
8.4.5　主程序157
8.5　总结159
第9章　基于OpenCV的神经网络简介160
9.1　人工神经网络160
9.2　人工神经网络的结构161
9.2.1　网络层级示例162
9.2.2　学习算法163
9.3　OpenCV中的ANN164
9.3.1　基于ANN的动物分类166
9.3.2　训练周期169
9.4　用人工神经网络进行手写数字识别170
9.4.1　MNIST—手写数字数据库170
9.4.2　定制训练数据170
9.4.3　初始参数171
9.4.4　迭代次数171
9.4.5　其他参数171
9.4.6　迷你库172
9.4.7　主文件175
9.5　可能的改进和潜在的应用180
9.5.1　改进180
9.5.2　应用181
9.6　总结181

前言/序言

Preface　前　言OpenCV3是一种先进的计算机视觉库，可以用于各种图像和视频处理操作，通过OpenCV3能很容易地实现一些有前景且功能先进的应用（比如：人脸识别或目标跟踪等）。理解与计算机视觉相关的算法、模型以及OpenCV3API背后的基本概念，有助于开发现实世界中的各种应用程序（比如：安全和监视领域的工具）。
《OpenCV 3计算机视觉：Python语言实现（原书第2版）》将从图像处理的基本操作出发，带你开启先进计算机视觉概念的探索之旅。计算机视觉是一个快速发展的学科，在现实生活中，它的应用增长得非常快，因此写作《OpenCV 3计算机视觉：Python语言实现（原书第2版）》的目的是为了帮助计算机视觉领域的新手和想要了解全新的OpenCV3.0.0的计算机视觉专家。
《OpenCV 3计算机视觉：Python语言实现（原书第2版）》的主要内容第1章介绍如何在不同平台下安装基于Python的OpenCV，并给出一些常见问题的解决方法。
第2章介绍了OpenCV的I/O功能，并讨论与项目相关的概念，以及如何针对该项目进行面向对象设计。
第3章介绍一些图像变换方法，例如在图像中检测肤色、锐化图像、标记主体轮廓，以及使用线段检测器检测人行横道等。
第4章介绍如何利用深度摄像头的数据来识别前景和背景区域，这样就可以限制针对前景或背景的效果。
第5章介绍一些OpenCV的人脸检测功能和相关的数据文件，这些文件定义了跟踪目标的特定类型。
第6章介绍如何用OpenCV来检测图像特征，并利用这些特征来匹配和搜索图像。
第7章介绍目标检测和目标识别的概念，这是计算机视觉中最常见的问题之一。
第8章对目标跟踪进行深入探讨，目标跟踪是对摄像机中的图像或视频中移动的物体进行定位的过程。
第9章介绍基于OpenCV的人工神经网络，并介绍其在现实生活中的应用。
阅读前的准备工作《OpenCV 3计算机视觉：Python语言实现（原书第2版）》第1章会指导读者安装所有必要软件，你只需准备一台较新的计算机。另外，强烈推荐为计算机安装摄像头，但这并不是必备的。
《OpenCV 3计算机视觉：Python语言实现（原书第2版）》的读者对象《OpenCV 3计算机视觉：Python语言实现（原书第2版）》针对具有一定Python工作经验的程序员以及想要利用OpenCV库研究计算机视觉课题的读者。《OpenCV 3计算机视觉：Python语言实现（原书第2版）》不要求读者具有计算机视觉或OpenCV经验，但要具有编程经验。
《OpenCV 3计算机视觉：Python语言实现（原书第2版）》体例《OpenCV 3计算机视觉：Python语言实现（原书第2版）》有很多用来区分不同信息的文本格式，下面给出一些这类格式的样例，并解释它们的含义。
代码块的格式如下：
为了提醒读者注意代码块中的特殊部分，会将相关行或相关项设置为粗体：
命令行的输入或输出的格式为：
注意：警告或重要注释以这样的形式出现。
提示：提示和技巧以这样的形式出现。
下载示例代码读者可登录华章网站（www.hzbook.com）《OpenCV 3计算机视觉：Python语言实现（原书第2版）》页面，下载《OpenCV 3计算机视觉：Python语言实现（原书第2版）》示例代码。
作者简介　AbuttheAuthorsJoeMinichino　是HooluxMedical从事计算机视觉的工程师，他利用业余时间开发了NoSQL数据库LokiJS。他也是重金属歌手/作曲家。他是一个充满激情的程序员，对编程语言和技术非常好奇，并一直在使用它们。在Hoolux，Joe领导了针对医疗行业的Android计算机视觉广告平台的开发。
他出生在意大利瓦雷泽市的Lombardy，并在那里长大，在米兰UniversitáStatale受过哲学教育，最近11年Joe在爱尔兰的Cork度过，在这里他成为Cork技术研究所的一名计算机科学研究生。
我非常感谢我的合作伙伴Rowena，她总是鼓励我，也感谢两个小女儿给我灵感。非常感谢这《OpenCV 3计算机视觉：Python语言实现（原书第2版）》的合作者和编辑，尤其是JoeHowse、AdrianRoesbrock、BrandonCastellano、OpenCV社区，以及Packt出版社中那些为《OpenCV 3计算机视觉：Python语言实现（原书第2版）》付出劳动的人。
JosephHowse　生活在加拿大。在冬天，他留着胡子，而他的四只猫留着厚皮毛。他喜欢每天给猫梳毛。有时猫还会抓他的胡子。
自2012年以来，他一直在为Packt出版社写作，他的著作包括《OpenCVforSecretAgents》《OpenCVBlueprints》《AndroidApplicationProgrammingwithOpenCV3》《OpenCVComputerVisionwithPython》以及《PythonGameProgrammingbyExample》。
当他不写书或打理萌宠时，他会提供咨询和培训，并通过他的公司（NummistMedia公司（http://nummist.com））进行软件开发服务。
AbuttheReviewers　审校者简介NandanBanerjee　拥有计算机科学学士学位和机器人工程硕士学位。他毕业后在三星电子工作。他在班加罗尔的研发中心工作了一年。为了参加DARPA机器人挑战，他还曾在位于Atlas的BostonDynamics机器人公司的WPI-CMU团队工作过。目前他是iRobot公司的一名机器人软件工程师。他是一名嵌入式系统和机器人爱好者，主要喜欢计算机视觉和运动规划。他熟悉各种语言，包括C、C++、Python、Java和Delphi。他在工作中会用到ROS、OpenRAVE、OpenCV、PCL、OpenGL、CUDA和AndroidSDK。
我要感谢作者和出版商能出版这样精彩的书。
TianCao　在美国教堂山的北卡罗来纳州大学攻读计算机科学博士学位，并参与图像分析、计算机视觉和机器学习等项目。
我将这项工作献给我的父母和女友。
BrandonCastellano　来自加拿大的学生，在加拿大伦敦市西安大略大学攻读电气工程硕士学位。在2012年，他获得同专业的学士学位。他主要研究实时图像处理算法的并行处理实现和GPGPU/FPGA优化。Brandon也在EagleVisionSystems公司工作过，他在这家公司主要专注于机器人应用中的实时图像处理。
虽然他使用OpenCV和C++超过5年了，但他在研究中一直提倡使用Python，因为Python开发速度快，可与复杂系统实现低级对接。他在GitHub上有开源项目，例如，PySceneDetect，这些项目大部分是用Python编写的。除了图像/视频处理，他还致力于实现三维展示，并提供软件工具来支持这样的开发。
他除了在他的网站（http://www.bcastell.com）上张贴技术文章和教程外，还参与各种开源和不开源的项目，他在GitHub上的用户名为Breakthrough（http://www.github.com/Breakthrough）。他是SuperUser和StackOverflow社区的活跃成员（其名字仍是Breakthrough），可直接通过他的网站与他联系。
我要感谢过去几年所有的朋友和家人的耐心（尤其是我的父母Peter和Lori以及我的兄弟Mitchell），没有他们持续的爱和支持，我不可能取得这一切成就。
我还要特别感谢所有致力开源软件库的开发者，特别是OpenCV，这有助于将前沿的软件技术免费带给世界各地的软件开发者。也想感谢那些写文档、提交错误报告和写教程/书籍（尤其是这《OpenCV 3计算机视觉：Python语言实现（原书第2版）》的作者！）的人们，你们的贡献对任何开源项目的成功至关重要，尤指像OpenCV这样复杂庞大的开源软件。
HaojianJin　位于加拿大Sunnyvale雅虎实验室的软件工程师/研究员。他主要开发移动新设备上（或最少硬件更改）的新系统。为了创建当今不存在的事物，他花费了大量时间来研究信号处理、计算机视觉、机器学习和自然语言处理，并以有趣的方式来使用它们。可在http://shift-3.com/上找到更多关于他的信息。
AdrianRosebrock　一位作家，也是http://www.pyimagesearch.com/的博主。他有马里兰大学计算机科学博士学位，侧重于计算机视觉和机器学习的研究。
他曾在癌症研究所从事通过乳腺图像来自动预测乳腺癌的危险因素的研究。他还写了《PracticalPythonandOpenCV》一书（http://pyimg.co/x7ed5），这《OpenCV 3计算机视觉：Python语言实现（原书第2版）》介绍如何利用Python和OpenCV来构建现实世界中的计算机视觉应用。
AbouttheTranslators　译者简介刘波　博士，重庆工商大学计算机科学与信息工程学院教师，主要从事机器学习理论、计算机视觉和最优化技术研究，同时对Hadoop和Spark平台上的大数据分析感兴趣，也对Linux编程和Oracle数据库感兴趣。
苗贝贝　硕士，北京工商大学计算机与信息工程学院研究生，主要从事机器学习理论、时间序列动力学特征分析及应用的研究，对基于Python的计算机视觉分析有浓厚的兴趣。
史斌　2015年本科毕业于电子科技大学计算机学院，目前就职于成都知数科技有限公司，主要从事数据爬取、数据处理、平台运维等工作，熟悉Python、Linuxshell，同时热爱计算机视觉编程，熟悉Python下的OpenCV编程。