编辑推荐
R语言与生俱来就拥有数据统计和分析的DNA,而且R语言本身并不是独立存在的程序设计语言。更准确地说,R语言以集成在一个R系统或环境中的方式呈现在我们面前,这个R系统集数据计算、数据处理、统计分析和图形绘制等软件包于一体,是一个完整的数据科学工具软件。
如今,以互联网大数据分析为基础的人工智能,如机器学习、商业智能、数据挖掘、文本挖掘、数据可视化等领域都渴求强大、高效的数据科学工具,这种渴求让R大放异彩。R系统本身就是一个开放的系统,除了传统的数据统计分析/绘图等软件包,现在更增加了机器学习、数据和文本挖掘、大数据分析等相关的诸多程序包,让R语言在这些领域成为“光彩夺目”的明星。
如果你对上述热门的领域之一感兴趣,并且想将R引入你的工作或研究中,那么《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》就是一本快速参考指南。《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》也可以作为完全不懂R软件及数据分析的读者自学R语言的本读物。
内容简介
《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》共分14章,内容主要有R语言简介、数据读取与写入的方法,条件判断、循环等流程控制以及自定义函数,高级绘图、低级绘图、交互式绘图的说明,决策树、支持向量机、人工神经网络的介绍,基本统计、机器学习、数据挖掘、文本挖掘、大数据分析的应用,层次聚类法、K平均聚类算法、模糊C平均聚类算法、聚类指标、基因算法及人工蜂群算法的应用。
《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》适合没有程序设计经验、想要接触R语言的人以及对统计、机器学习、数据挖掘、文本挖掘、大数据分析有兴趣的人阅读。
目录
第1章R简介11.1开始使用R软件1
1.2R对象4
1.2.1向量4
1.2.2数组5
1.2.3矩阵7
1.2.4数据框9
1.2.5因子11
1.2.6列表11
1.2.7对象转换12
第2章数据的读取与写入14
2.1数据的读取14
2.2数据的写入与数据集17
2.3RData格式数据的写入与读取18
2.4读取SQLServer数据库的数据19
第3章流程控制及自定义函数20
3.1条件执行20
3.2循环控制22
3.3自定义函数25
第4章绘图功能及基本统计27
4.1高级绘图27
4.2低级绘图30
4.3交互式绘图31
4.4图形参数32
4.5基本统计34
第5章相关程序包的介绍39
5.1机器学习39
5.2数据挖掘40
5.3社交网络分析及文本挖掘40
5.4大数据分析41
5.5程序包的介绍41
第6章监督式学习51
6.1决策树51
6.2支持向量机61
6.3人工神经网络65
6.4组合方法70
6.4.1随机森林70
6.4.2推进法71
第7章无监督式学习72
7.1层次聚类法72
7.2K平均聚类算法75
7.3模糊C平均聚类算法77
7.4聚类指标83
第8章进化式学习86
8.1基因算法86
8.2人工蜂群算法92
第9章混合式学习95
9.1使用C50和ABCoptim程序包范例95
9.2使用基因算法来调整人工神经网络参数的范例97
第10章关联规则107
10.1关联规则简介107
10.2Apriori算法108
第11章社交网络分析和文本挖掘117
11.1社交网络分析117
11.2文本挖掘122
第12章图形化数据分析工具125
12.1导入数据126
12.1.1处理数据集130
12.1.2设置变量131
12.2探索和测试数据131
12.3转换数据135
12.4建立、评估和导出模型137
第13章大数据分析(R+Hadoop)141
13.1Hadoop简介141
13.2R+Hadoop142
第14章SparkR大数据分析170
14.1dplyr数据处理程序包172
14.2SparkR数据处理175
14.3SparkR与SQLServer181
14.4SparkR与Cassandra184
14.5SparkStandalone模式186
14.6SparkR数据分析189
附录A下载和安装R197
附录B安装RStudioDesktop203
附录C安装ODBC209
附录D指令及用法214
附录E在虚拟机上安装R+Hadoop218
附录F在虚拟机上安装SparkR247
参考文献272
前言/序言
前言
随着R软件的流行及普及化,许多学者和专家转而使用R作为研究与开发的工具。R软件有Windows、UNIX、Linux及AppleMacOS等不同操作系统的免费版本,更有一万种以上免费程序包可供使用,所以学习R软件是睿智的选择。
《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》内容共有14章,前4章先介绍R软件的基本操作和应用,第5章对《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》所使用的程序包做完整的介绍,包含R软件在机器学习(MachineLearning)、数据挖掘(DataMining)、文本挖掘(TextMining)及大数据(BigData)分析的相关程序包,第6~9章介绍各类学习算法,第10~12章介绍关联规则、网络社群分析及文本挖掘、图形化数据分析工具,最后两章介绍Hadoop和Spark大数据分析。
《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》是作者多年来从事教学的心血结晶,适合作为大专院校信息类相关科系的教材,同时书中范例的程序代码丰富,也可作为练习的补充教材。《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》的撰写以完全不懂R软件及数据分析的读者为对象,对于有意愿自学的读者而言,《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》也是一本不错的入门参考书。
《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》配套范例程序可从下面的网址(注意区分数字和字母大小写)下载或扫描右边的二维码获取:
https://pan.baidu.com/s/17b-xnYfhICguW4wSz8pWXA
如果下载有问题,请联系booksaga@126.com,邮件主题为“零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析”。
《零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析》的撰写虽已力求完美,但难免会有疏漏之处,欢迎各位读者指教。
李仁钟、李秋缘
2018年6月