编辑推荐
适读人群:《基于R语言的机器学习》非常适合对R编程语言有一定了解的人。如果不了解R语言,那么也不用担心,R是一种很容易学习的语言,并且代码可读性很强,相信你可以掌握代码示例中的要点。
■介绍机器学习领域的模型、算法和数据训练。
■了解监督和非监督机器学习算法。
■针对模型使用的数据进行统计验证。
■深入了解商业和科学中使用的线性回归模型。
■使用单层和多层神经网络计算结果。
■介绍基于树的模型的工作原理,以及流行的决策树。
■了解R语言中机器学习的生态环境。
■介绍R语言提供的强大的工具caret包。内容简介
■介绍机器学习领域的模型、算法和数据训练。
■了解监督和非监督机器学习算法。
■针对模型使用的数据进行统计验证。
■深入了解商业和科学中使用的线性回归模型。
■使用单层和多层神经网络计算结果。
■介绍基于树的模型的工作原理,以及流行的决策树。
■了解R语言中机器学习的生态环境。
■介绍R语言提供的强大的工具caret包。作者简介
ScottV.Burger是一名高数据科学家,居住在美国西雅图。他拥有天体物理学领域的编程经验,并将这些经验用于各种不同的方面,例如商业智能或数据优化等。Scott拥有关于如何用简洁的方式向公众解释科学概念的丰富经验,他利用这些专业知识在《基于R语言的机器学习》中向普通R语言用户揭示了机器学习的世界。目录
前言1
第1章什么是模型?5
算法与模型有什么不同?10
术语说明12
模型的局限性13
建模中的统计与计算15
数据训练16
交叉验证17
为什么使用R语言?18
优点19
缺点22
小结23
第2章监督学习与无监督机器学习25
监督模型26
回归26
训练数据与测试数据28
分类30
混合方法37
无监督学习47
无监督聚类方法48
小结50
第3章R语言中的采样统计和模型训练52
偏差53
R语言中的采样58
训练与测试61
交叉验证74
小结76
第4章全面解析回归78
线性回归79
多项式回归88
拟合数据的优点——过度拟合的风险95
逻辑回归98
小结112
第5章全面解析神经网络115
单层神经网络115
用R语言建立一个简单的神经网络116
多层神经网络125
回归神经网络131
神经网络分类136
使用caret的神经网络137
小结139
第6章基于树的方法141
简单的树模型141
决定树的分割方式143
决策树的优点和缺点147
条件推理树158
随机森林161
小结164
第7章其他高级方法165
朴素贝叶斯分类165
主成分分析169
支持向量机179
k最近邻算法185
小结191
第8章使用caret包实现机器学习192
泰坦尼克号数据集193
使用caret196
小结207
附录Acaret机器学习模型大全209前言/序言
前言
在这篇简短的介绍中,我将讨论几个关键点。
《基于R语言的机器学习》面向的读者对象
《基于R语言的机器学习》非常适合对R编程语言有一定了解的人。如果不了解R语言,那么也不用担心,R是一种很容易学习的语言,并且代码可读性很强,相信你可以掌握代码示例中的要点。
《基于R语言的机器学习》的范围
《基于R语言的机器学习》是入门级的图书,所以我们不会深入研究每种算法涉及的数学知识。书中展示的内容可以帮助你大致掌握一些基本概念,比如神经网络与随机森林之间的区别等。
排版约定
《基于R语言的机器学习》使用了下述排版约定。
斜体(Italic)
表示新术语、URL、示例电子邮件地址、文件名、扩展名、路径名和目录。
等宽字体(ConstantWidth)
表示代码,在段内用以表示与代码相关的元素,如变量或函数名、数据库、数据类型、环境变量、声明和关键字。
等宽粗体字(Constantwidthbold)
表示命令或其他用户输入的文本。
斜体等宽字体(ConstantWidthItalic)
表示该文本应当由用户提供的值或由用户根据上下文决定的值替换。
O’ReillySafari
Safari(以前的SafariBooksOnline)是面向企业、政府、教育和个人的会员制培训与参考平台。
Safari的会员可以访问成千上万的书籍、培训视频、学习路径、交互式教程和推荐的书单。这些内容由250多家出版社提供,其中包括:O’ReillyMedia、HarvardBusinessReview、PrenticeHallProfessional、Addison-WesleyProfessional、MicrosoftPress、Sams、Que、PeachpitPress、Adobe、FocalPress、CiscoPress、JohnWiley&Sons、Syngress、MorganKaufmann、IBMRedbooks、Packt、AdobePress、FTPress、Apress、Manning、NewRiders、McGraw-Hill、Jones&Bartlett和CourseTechnology等。
更多关于Safari的信息,请访问我们的网站:http://oreilly.com/safari。
联系我们
请把你对《基于R语言的机器学习》的意见和疑问发给出版社:
美国:
O’ReillyMedia,Inc.
1005GravensteinHighwayNorth
Sebastopol,CA95472
中国:
北京市西城区西直门南大街2号成铭大厦C座807室(100035)
奥莱利技术咨询(北京)有限公司
这《基于R语言的机器学习》有专属网页,你可以在那里找到《基于R语言的机器学习》的勘误、示例和其他信息。这个网页的地址是http://bit.ly/intro_ML_withR。
如果你对《基于R语言的机器学习》有一些评论或技术上的建议,请发送电子邮件到:
bookquestions@oreilly.com。
要了解O’Reilly图书、培训课程、会议和新闻的更多信息,请访问我们的网站:
http://www.oreilly.com
http://www.oreilly.com.cn
请在Facebook上联系我们,地址是:http://facebook.com/oreilly。
请在Twitter上关注我们,地址是:http://twitter.com/oreillymedia。
请观看我们的Youtube视频,地址是:http://www.youtube.com/oreillymedia。
致谢
写书一直是我的梦想。小学三四年级的时候,我想写的书是关于我收集的毛绒动物玩具的脱口秀。我从来没想过有一天,我的技术能力足够强到可以为大家讲解复杂的机器学习。一路走到今天,发生了很多事情,我想在这里感谢所有帮助过我写这《基于R语言的机器学习》的人:AllisonRandal、AmandaHarris、CristianoSabiu、DorothyDuffy、ElayneBritain、FilipeAbdalla、HeatherScherer、IanFurniss、KristenBrown、KristenLarson、MarieBeaugureau、MaxWinderbaum、MyrnaFant、RichardFant、RobertLippens、WillWright和WoodyCiskowski。