编辑推荐

不同类型文本数据的获取、清洗、组织和可视化
如何用NumPy和Pandas模块处理数值数据
探索用MySQL和MongoDB配置、填充、查询数据
网络创建、度量和分析
概率与统计以及机器学习的相关基本概念

内容简介

《Python数据科学入门》以Python语言讲解数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python核心特性,文本数据、数据库、表格形式的数值数据、series和frame、网络数据的使用,数据的绘制,概率与统计,机器学习。
《Python数据科学入门》面向研究生和本科生、数据科学教员、刚入门的数据科学专业人员,以及那些想拥有一本参考手册来帮助记住所有Python函数及参数的开发人员。

作者简介

DmitryZinoviev
计算机科学教授,自2001年起一直在萨福克大学任教。研究兴趣包括计算机模拟与建模、网络科学、社交网络分析以及数字人文。拥有莫斯科国立大学物理学硕士学位和纽约州立大学石溪分校计算机科学博士学位。

目录

第1章什么是数据科学1
第1单元数据分析步骤2
第2单元数据获取途径3
第3单元报告的结构4
轮到你了5
第2章数据科学的Python核心6
第4单元理解基本的字符串函数6
第5单元选择合适的数据结构8
第6单元通过列表推导式理解列表9
第7单元使用计数器10
第8单元使用文件11
第9单元上网12
第10单元使用正则表达式实现模式匹配13
第11单元globbing文件名与其他字符串17
第12单元Pickling和Unpickling数据18
轮到你了18
第3章使用文本数据20
第13单元处理HTML文件20
第14单元处理CSV文件24
第15单元读取JSON文件25
第16单元处理自然语言中的文本27
轮到你了31
第4章使用数据库33
第17单元设置MySQL数据库33
第18单元使用MySQL数据库:命令行36
第19单元使用MySQL数据库:pymysql39
第20单元改善文档存储:MongoDB41
轮到你了44
第5章使用表格形式的数值数据45
第21单元创建数组46
第22单元转置和重排48
第23单元索引和切片49
第24单元广播51
第25单元揭秘通用函数52
第26单元理解条件函数54
第27单元数组的聚合与排序54
第28单元将数组用作集合56
第29单元数组的保存和读取57
第30单元生成合成正弦波57
轮到你了59
第6章使用series和frame61
第31单元pandas数据结构62
第32单元数据重塑67
第33单元处理缺失数据72
第34单元组合数据75
第35单元数据的排序和描述78
第36单元数据转换82
第37单元掌握pandas的文件读写功能87
轮到你了90
第7章使用网络数据91
第38单元概念剖析91
第39单元网络分析序列94
第40单元使用networkx95
轮到你了101
第8章绘图103
第41单元使用PyPlot进行基本绘图104
第42单元了解其他绘图类型106
第43单元精通绘图装饰107
第44单元用pandas绘图109
轮到你了111
第9章概率与统计113
第45单元回顾概率分布113
第46单元回顾统计度量115
第47单元以Python的方式完成统计117
轮到你了120
第10章机器学习122
第48单元设计预测实验122
第49单元线性回归拟合124
第50单元用k均值聚类实现数据分组129
第51单元在随机决策森林中生存131
轮到你了133
附录1扩展阅读135
附录2单星项目的解决方案137
参考文献146

其他推荐