编辑推荐

  用火的Python语言、通过各种各样的机器学习算法来解决实际问题!  书中介绍的主要问题如下。  -探索分类分析算法并将其应用于收入等级评估问题  -使用预测建模并将其应用到实际问题中  -了解如何使用无监督学习来执行市场细分  -探索数据可视化技术以多种方式与数据进行交互  -了解如何构建推荐引擎  -理解如何与文本数据交互并构建模型来分析它  -使用隐马尔科夫模型来研究语音数据并识别语音

内容简介

  在如今这个处处以数据驱动的世界中,机器学习正变得越来越大众化。它已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。《Python机器学习经典实例》首先通过实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极-端随机森林、隐马尔可夫模型、条件随机场、深度神经网络,等等。

作者简介

  PrateekJoshi人工智能专家,重点关注基于内容的分析和深度学习,曾在英伟达、微软研究院、高通公司以及硅谷的几家早期创业公司任职。个人博客地址:www.prateekj.com

目录

第1章监督学习.............................................1
1.1简介.................................................1
1.2数据预处理技术.......................................2
1.2.1准备工作.......................................2
1.2.2详细步骤.......................................2
1.3标记编码方法...........................................4
1.4创建线性回归器.......................................6
1.4.1准备工作.......................................6
1.4.2详细步骤.......................................7
1.5计算回归准确性.......................................9
1.5.1准备工作.......................................9
1.5.2详细步骤......................................10
1.6保存模型数据..........................................10
1.7创建岭回归器..........................................11
1.7.1准备工作......................................11
1.7.2详细步骤......................................12
1.8创建多项式回归器..................................13
1.8.1准备工作......................................13
1.8.2详细步骤......................................14
1.9估算房屋价格..........................................15
1.9.1准备工作......................................15
1.9.2详细步骤......................................16
1.10计算特征的相对重要性.........................17
1.11评估共享单车的需求分布.....................19
1.11.1准备工作..................................19
1.11.2详细步骤..................................19
1.11.3更多内容..................................21
第2章创建分类器........................................24
2.1简介...........................................24
2.2建立简单分类器......................................25
2.2.1详细步骤......................................25
2.2.2更多内容......................................27
2.3建立逻辑回归分类器..............................27
2.4建立朴素贝叶斯分类器...........................31
2.5将数据集分割成训练集和测试集...........32
2.6用交叉验证检验模型准确性...................33
2.6.1准备工作......................................34
2.6.2详细步骤......................................34
2.7混淆矩阵可视化......................................35
2.8提取性能报告..........................................37
2.9根据汽车特征评估质量...........................38
2.9.1准备工作......................................38
2.9.2详细步骤......................................38
2.10生成验证曲线........................................40
2.11生成学习曲线........................................43
2.12估算收入阶层........................................45
第3章预测建模............................................48
3.1简介............................................48
3.2用SVM建立线性分类器........................49
3.2.1准备工作......................................49
3.2.2详细步骤......................................50
3.3用SVM建立非线性分类器....................53
3.4解决类型数量不平衡问题.......................55
3.5提取置信度..............................................58
3.6寻找最优超参数......................................60
3.7建立事件预测器......................................62
3.7.1准备工作......................................62
3.7.2详细步骤......................................62
3.8估算交通流量..........................................64
3.8.1准备工作......................................64
3.8.2详细步骤......................................64
第4章无监督学习——聚类.......................67
4.1简介.......................................67
4.2用k-means算法聚类数据.......................67
4.3用矢量量化压缩图片..............................70
4.4建立均值漂移聚类模型...........................74
4.5用凝聚层次聚类进行数据分组...............76
4.6评价聚类算法的聚类效果.......................79
4.7用DBSCAN算法自动估算集群数量.....82
4.8探索股票数据的模式..............................86
4.9建立客户细分模型..................................88
第5章构建推荐引擎...................................91
5.1简介......................................91
5.2为数据处理构建函数组合.......................92
5.3构建机器学习流水线..............................93
5.3.1详细步骤......................................93
5.3.2工作原理......................................95
5.4寻找最近邻..............................................95
5.5构建一个KNN分类器............................98
5.5.1详细步骤......................................98
5.5.2工作原理....................................102
5.6构建一个KNN回归器..........................102
5.6.1详细步骤....................................102
5.6.2工作原理....................................104
5.7计算欧氏距离分数................................105
5.8计算皮尔逊相关系数............................106
5.9寻找数据集中的相似用户.....................108
5.10生成电影推荐......................................109
第6章分析文本数据.................................112
6.1简介.......................................112
6.2用标记解析的方法预处理数据.............113
6.3提取文本数据的词干............................114
6.3.1详细步骤....................................114
6.3.2工作原理....................................115
6.4用词形还原的方法还原文本的基本形式....................116
6.5用分块的方法划分文本........................117
6.6创建词袋模型........................................118
6.6.1详细步骤....................................118
6.6.2工作原理....................................120
6.7创建文本分类器....................................121
6.7.1详细步骤....................................121
6.7.2工作原理....................................123
6.8识别性别.............................................124
6.9分析句子的情感....................................125
6.9.1详细步骤....................................126
6.9.2工作原理....................................128
6.10用主题建模识别文本的模式...............128
6.10.1详细步骤..................................128
6.10.2工作原理..................................131
第7章语音识别.........................................132
7.1简介..........................................132
7.2读取和绘制音频数据............................132
7.3将音频信号转换为频域........................134
7.4自定义参数生成音频信号.....................136
7.5合成音乐..........................................138
7.6提取频域特征........................................140
7.7创建隐马尔科夫模型............................142
7.8创建一个语音识别器............................143
第8章解剖时间序列和时序数据............147
8.1简介.............................................147
8.2将数据转换为时间序列格式.................148
8.3切分时间序列数据................................150
8.4操作时间序列数据................................152
8.5从时间序列数据中提取统计数字.........154
8.6针对序列数据创建隐马尔科夫模型.....157
8.6.1准备工作....................................158
8.6.2详细步骤....................................158
8.7针对序列文本数据创建条件随机场.....161
8.7.1准备工作....................................161
8.7.2详细步骤....................................161
8.8用隐马尔科夫模型分析股票市场数据..........................164
第9章图像内容分析.................................166
9.1简介..............................................166
9.2用OpenCV-Pyhon操作图像.................167
9.3检测边........................................170
9.4直方图均衡化........................................174
9.5检测棱角..................................176
9.6检测SIFT特征点..................................178
9.7创建Star特征检测器............................180
9.8利用视觉码本和向量量化创建特征......182
9.9用极端随机森林训练图像分类器..........185
9.10创建一个对象识别器...........................187
第10章人脸识别........................................189
10.1简介...........................................189
10.2从网络摄像头采集和处理视频信息....189
10.3用Haar级联创建一个人脸识别器......191
10.4创建一个眼睛和鼻子检测器...............193
10.5做主成分分析......................................196
10.6做核主成分分析..................................197
10.7做盲源分离..........................................201
10.8用局部二值模式直方图创建一个人脸识别器................205
第11章深度神经网络...............................210
11.1简介........................................210
11.2创建一个感知器..................................211
11.3创建一个单层神经网络.......................213
11.4创建一个深度神经网络.......................216
11.5创建一个向量量化器...........................219
11.6为序列数据分析创建一个递归神经网络......................221
11.7在光学字符识别数据库中将字符可视化......................225
11.8用神经网络创建一个光学字符识别器.......................226
第12章可视化数据...................................230
12.1简介...............................................230
12.2画3D散点图.......................................230
12.3画气泡图............................................232
12.4画动态气泡图......................................233
12.5画饼图...............................................235
12.6画日期格式的时间序列数据...............237
12.7画直方图............................................239
12.8可视化热力图......................................241
12.9动态信号的可视化模拟.......................242

其他推荐