编辑推荐
适读人群:深度学习从业者及研究人员
《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》讨论使用TensorFlow和Keras等框架构建深度学习应用,如计算机视觉、语音识别以及聊天机器人。《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》集中于深度学习应用所需的模型和算法,帮助你在短时间内提高实践技能。《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》覆盖了聊天机器人、自然语言处理、人脸和物体识别等话题,目标是为创建能够执行深度学习的程序提供所需的概念、技术和算法实现。
《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》涉及中高级的深度学习技术,其中包括卷积神经网络、循环神经网络以及多层感知机,同时探讨了一些比较流行的API,比如IBMWatson、MicrosoftAzure以及scikit-learn。
通过阅读《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》,你会学习:
如何运用各种各样的深度学习框架,如TensorFlow、Keras以及scikit-learn
如何构建人脸识别和人脸检测
如何实现语音到文本以及文本到语音的转换
如何用深度学习创建聊天机器人
内容简介
《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》讨论使用TensorFlow和Keras等框架构建深度学习应用,如计算机视觉、语音识别以及聊天机器人。
第1章主要介绍TensorFlow基础,包括张量、计算图与会话等内容;
第2章介绍理解并运用Keras,涵盖了深度学习模型构建的主要步骤;
第3章、第4章、第5章介绍多层感知机,并分别介绍了TensorFlow及Keras中回归与多层感知机的实现;
第6章、第7章、第8章介绍卷积神经网络,并分别介绍了TensorFlow及Keras中卷积神经网络的实现;
第9章进入序列相关的处理,介绍了RNN和LSTM;
第10章介绍语音和文本的处理;
第11章讲述结合前面所学知识,创建聊天机器人;
第12章介绍了人脸检测与识别相关的内容。
作者简介
纳温·库马尔·马纳西(NavinKumarManaswi)多年来一直使用人工智能相关的尖端技术开发AI解决方案。曾在位于马来西亚、新加坡的咨询公司以及迪拜智慧城市项目任职。他拥有自己的公司,曾开发出一种多方法混合的技术,用于端到端的人工智能解决方案的分发,包括视频智能、文本智能以及类人聊天机器人。目前,他致力于解决医疗保健、企业应用、工业IoT方向的B2B问题,并作为一名深度学习AI架构师在SymphonyAIIncubator兼职。在《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》中,他希望面向开发者、数据科学家、软件工程师、数据库工程师、数据分析师以及C级管理者介绍认知计算与服务。
目录
序
第1章 TensorFlow基础1
1.1 张量2
1.2 计算图与会话2
1.3 常量、占位符与变量4
1.4 占位符6
1.5 创建张量8
1.5.1 固定张量9
1.5.2 序列张量11
1.5.3 随机张量11
1.6 矩阵操作12
1.7 激活函数13
1.7.1 双曲正切函数与Sigmoid函数13
1.7.2 ReLU与ELU15
1.7.3 ReLU615
1.8 损失函数17
1.8.1 损失函数实例18
1.8.2 常用的损失函数18
1.9 优化器19
1.9.1 优化器实例20
1.9.2 常用的优化器21
1.10 度量21
??1.10.1 度量实例22
??1.10.2 常用的度量22
第2章 理解并运用Keras25
2.1 深度学习模型构建的主要步骤25
2.1.1 载入数据26
2.1.2 预处理数据27
2.1.3 定义模型27
2.1.4 编译模型29
2.1.5 拟合模型29
2.1.6 评估模型30
2.1.7 预测30
2.1.8 保存与重载模型31
2.1.9 可选:总结模型31
2.2 改进Keras模型的附加步骤32
2.3 Keras联合TensorFlow33
第3章 多层感知机35
3.1 人工神经网络35
3.2 单层感知机37
3.3 多层感知机37
3.4 逻辑斯谛回归模型38
第4章 TensorFlow中的回归到MLP45
4.1 TensorFlow搭建模型的步骤45
4.2 TensorFlow中的线性回归46
4.3 逻辑斯谛回归模型49
4.4 TensorFlow中的多层感知机52
第5章 Keras中的回归到MLP55
5.1 对数-线性模型55
5.2 线性回归的Keras神经网络56
5.3 逻辑斯谛回归58
5.3.1scikit-learn逻辑斯谛回归58
5.3.2逻辑斯谛回归的Keras神经网络59
5.3.3流行的MNIST数据:Keras中的逻辑斯谛回归60
5.4 基于Iris数据的MLP62
5.4.1 编写代码62
5.4.2构建一个序列Keras模型63
5.5基于MNIST数据的MLP数字分类66
5.6 基于随机生成数据的MLP68
第6章 卷积神经网络71
6.1 CNN中的各种层71
6.2 CNN结构74
第7章 TensorFlow中的CNN77
7.1为什么用TensorFlow搭建CNN模型77
7.2基于MNIST数据集搭建图片分类器的TensorFlow代码78
7.3 使用高级API搭建CNN模型82
第8章 Keras中的CNN83
8.1在Keras中使用MNIST数据集搭建图片分类器83
8.1.1 定义网络结构85
8.1.2 定义模型架构85
8.2使用CIFAR-10数据集搭建图片分类器86
8.2.1 定义网络结构87
8.2.2 定义模型架构88
8.3 预训练模型89
第9章 RNN与LSTM91
9.1 循环神经网络的概念91
9.2 长短时记忆网络的概念93
9.3 LSTM常见模式93
9.4 序列预测94
9.4.1 数字序列预测94
9.4.2 序列分类95
9.4.3 序列生成95
9.4.4 序列到序列预测95
9.5利用LSTM模型处理时间序列预测问题96
第10章 语音-文本转换及其逆过程101
10.1 语音-文本转换101
10.2 语音数据102
10.3语音特征:将语音映射为矩阵103
10.4声谱图:将语音映射为图像104
10.5利用MFCC特征构建语音识别分类器104
10.6利用声谱图构建语音识别分类器105
10.7 开源方法106
10.8 使用API的例子107
10.8.1 使用PocketSphinx107
10.8.2使用GoogleSpeechAPI108
10.8.3使用GoogleCloudSpeechAPI108
10.8.4 使用Wit.aiAPI108
10.8.5 使用HoundifyAPI109
10.8.6使用IBMSpeechtoTextAPI109
10.8.7使用BingVoiceRecognitionAPI110
10.9 文本-语音转换110
10.9.1 使用pyttsx110
10.9.2 使用SAPI111
10.9.3 使用SpeechLib111
10.10 音频剪辑代码111
10.11 认知服务提供商112
10.11.1 MicrosoftAzure113
10.11.2 CognitiveServices113
10.11.3 IBMWatsonServices113
10.12 语音分析的未来113
第11章 创建聊天机器人115
11.1 为什么是聊天机器人116
11.2 聊天机器人的设计和功能116
11.3 构建聊天机器人的步骤116
11.3.1 预处理文本和消息117
11.3.2用API构建聊天机器人130
11.4聊天机器人开发的最佳实践133
11.4.1 了解潜在用户133
11.4.2读入用户情感使得机器人情感更丰富133
第12章 人脸检测与识别135
12.1人脸检测、人脸识别与人脸分析135
12.2 OpenCV136
12.2.1 特征脸137
12.2.2 LBPH137
12.2.3 费歇脸138
12.3 检测人脸139
12.4 跟踪人脸141
12.5 人脸识别144
12.6 基于深度学习的人脸识别147
12.7 迁移学习149
12.7.1为什么要用迁移学习150
12.7.2 迁移学习实例150
12.7.3 计算迁移值152
12.8 API158
附录1 图像处理的Keras函数161
附录2 可用的优质图像数据集165
附录3 医学成像:DICOM文件格式167
前言/序言
深度学习经历了很长时间的发展,从最初试图理解人类心智与观念联想论的概念—我们是如何理解事物以及物体和观点之间的关系是如何影响我们的思考和行为的,直到对联想行为进行建模。后者始于19世纪70年代,亚历山大·贝恩(AlexanderBain)通过组合神经元的方式开启了人工神经网络的篇章。
到2018年,我们看到了深度学习如何被显著改进并以各种各样的形式呈现出来—从物体检测、语音识别、机器翻译、自动驾驶、人脸检测以及人脸检测的日常应用(比如解锁你的iPhoneX),到实现更复杂的任务(比如犯罪活动的甄别与预防)。
卷积神经网络(CNN)和循环神经网络(RNN)正熠熠生辉,因为它们接连不断地帮助人们解决世界性的问题,毫不夸张地说是在所有的行业领域,如自动化交通与运输、医疗卫生与保健、零售业等。这些领域正在取得重大进展,通过以下这些指标就足以说明深度学习领域的活力:
自1996年起,计算机科学的学术论文数已经飙升了10倍以上。
自2000年起,风险投资对AI初创公司的投资增加了6倍以上。
自2000年起,活跃的AI初创公司的数量增加了14倍以上。
自2013年起,所有AI相关的工作市场雇佣量增加了5倍以上,并且深度学习在2018年是最抢手的技能。
84%的企业相信投资AI会使它们具有强大的竞争优势。
图像分类的错误率已经从2012年的28%下降到了2017年的2.5%,并且还一直在下降!
尽管如此,研究者并不满足。我与我的同行们正在一起推动和发展新的胶囊网络(CapsNet),这将大为拓展深度学习的边界。我不是独自在战斗。很高兴能为Navin这《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》作序,Navin是我熟知的深度学习领域中一位备受尊敬的专家。
这《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》恰逢其时。此刻,无论是业界从业者还是研究者都急需通过实践来提高他们对深度学习的理解并最终将其应用到实际工作中。
我确信Navin这《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》能给学习者提供所需的知识。TensorFlow框架正在迅速成为市场的引领者,Keras也越来越多地被用来解决计算机视觉和自然语言处理中的问题。这两个框架如此重要,以至于还没有哪个相关行业的公司不使用它们。
期待这《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》的出版!
TarrySingh
Deepkapha.ai的建立者和AI神经科学研究员
Coursera的深度学习导师