内容简介

随着大数据的兴起,Python和机器学习迅速成为时代的宠儿。《Python在机器学习中的应用》在内容编排上避免了枯燥的理论知识讲解,依循“理论简述——实际数据集——Python程序实现算法”分析数据的思路,根据实际数据集的分析目的,采用合适的主流机器学习算法来解决问题。《Python在机器学习中的应用》共12章,其中第1~4章介绍了机器学习的基础知识;第5~12章讨论了在面对不同的数据时,如何采用一些主流的算法来解决问题,主要包括回归分析、关联规则、无监督学习、文本LDA模型、决策树和集成学习、朴素贝叶斯和K近邻分类、支持向量机和神经网络,以及深

度学习入门等内容。针对每个算法,都给出Python代码实现算法建模的过程,并结合可视化技术,帮助读者更好地理解算法和分析结果。

《Python在机器学习中的应用》是使用Python进行机器学习的入门实战教程,可作为以Python为基础进行机器学习的本科生和研究生入门书籍,也可供对Python机器学习感兴趣的研究人员参考阅读。

作者简介

余本国,博士,硕士研究生导师。于中北大学理学系任教,主讲线性代数、微积分、Python语言、大数据分析基础等课程。2012年到加拿大YorkUniversity做访问学者。出版有《Python数据分析基础》《基于Python的大数据分析基础及实战》等著作。

目录

第1章机器学习简介

1.1机器学习的任务

1.2机器学习的三种方式

1.3机器学习系统的建立

1.4机器学习实例

第2章Python常用库介绍

2.1Python的安装(Anaconda)

2.1.1Spyder

2.1.2JupyterNotebook

2.2Python常用库

2.2.1Numpy库

2.2.2Pandas库

2.2.3Matplotlib库

2.2.4Statsmodels库

2.2.5Scikit-learn库

2.3其他Python常用的数据库

2.4Python各种库在机器学习中的应用

第3章数据的准备和探索

3.1数据预处理

3.2数据假设检验

3.3数据间的关系

3.4数据可视化

3.5特征提取和降维

第4章模型训练和评估

4.1模型训练技巧

4.2分类效果的评价

4.3回归模型评价

4.4聚类分析评估

第5章回归分析

5.1回归分析简介

5.2多元线性回归分析

5.2.1多元线性回归

5.2.2逐步回归

5.3Lasso回归分析

5.4Logistic回归分析

5.5时间序列预测

第6章关联规则

6.1关联规则简介

6.2使用关联规则找到问卷的规则

6.3关联规则可视化

第7章无监督学习

7.1无监督学习介绍

7.2系统聚类

7.3K-均值聚类

7.4密度聚类

7.5MeanShift聚类

7.6字典学习图像去噪

第8章文本LDA模型

8.1文本分析简介

8.2中文分词

8.3LDA主题模型分析《红楼梦》

8.4红楼梦人物关系

第9章决策树和集成学习

9.1模型简介

9.2泰坦尼克号数据预处理

9.3决策树模型

9.4决策树剪枝

9.5随机森林模型

9.6AdaBoost模型

第10章朴素贝叶斯和K近邻分类

10.1模型简介

10.2垃圾邮件数据预处理

10.3贝叶斯模型识别垃圾邮件

10.4基于异常值检测的垃圾邮件查找

10.4.1PCA异常值检测

10.4.2IsolationForest异常值检测

10.5数据不平衡问题的处理

10.6K近邻分类

第11章支持向量机和神经网络

11.1模型简介

11.2肺癌数据可视化

11.3支持向量机模型

11.4全连接神经网络

第12章深度学习入门

12.1深度学习介绍

12.2卷积和池化

12.3CNN人脸识别

12.4CNN人脸检测

12.5深度卷积图像去噪

12.5.1空洞卷积

12.5.2图像与图像块的相互转换

12.5.3一种深度学习去噪方法


其他推荐