内容简介

R语言商业分析实战》详细阐述了与R语言商业分析相关的基本解决方案,主要包括商业分析简介、R语言概述、R语言数据分析、描述性分析概述、商业分析过程与数据探索、机器学习、线性回归分析以及逻辑回归分析等内容。此外,《R语言商业分析实战》还提供了相应的示例,以帮助读者进一步理解相关方案的实现过程。

R语言商业分析实战》适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。

目录

目录

第1章商业分析简介1

1.1《R语言商业分析实战》目的3

1.2容易混淆的术语3

1.3商业分析的发展动因4

1.3.1计算机软件包和应用程序的增长5

1.3.2整合各种数据源的可行性5

1.3.3无限存储和计算能力的增长6

1.3.4简单易用的编程工具和平台6

1.3.5竞争激烈世界中的生存与发展6

1.3.6全球化商业的复杂性6

1.4商业分析的应用6

1.4.1市场营销与销售7

1.4.2人力资源7

1.4.3产品设计7

1.4.4服务设计8

1.4.5客户服务和支持范围8

1.5商业分析师的必备技能8

1.5.1理解商业和商业问题8

1.5.2理解数据分析技术和算法9

1.5.3具备良好的计算机编程知识9

1.5.4理解数据结构和数据存储/仓储技术9

1.5.5了解统计学和数学的相关概念知识9

1.6商业分析项目的分析过程10

1.7商业分析框架11

1.8小结12

第2章R语言概述13

2.1数据分析工具13

2.2R语言安装16

2.2.1安装R语言16

2.2.2安装RStudio17

2.2.3探索RStudio界面18

2.3R编程基础19

2.3.1赋值20

2.3.2创建向量21

2.4R语言对象类型21

2.5R语言的数据结构23

2.5.1矩阵23

2.5.2数组24

2.5.3数据框26

2.5.4列表27

2.5.5因子28

2.6小结29

第3章R语言数据分析31

3.1读写数据31

3.1.1从文本文件读取数据32

3.1.2从MicrosoftExcel文件读取数据35

3.1.3从Web读取数据37

3.2在R语言中使用控制结构37

3.2.1if-else38

3.2.2for循环39

3.2.3while循环39

3.2.4循环功能40

3.2.5在R语言中自编函数47

3.3使用R语言软件包和库48

3.4小结49

第4章描述性分析概述51

4.1描述性分析54

4.2总体和样本54

4.3有关的统计参数55

4.3.1均值55

4.3.2中位数57

4.3.3众数59

4.3.4全距59

4.3.5分位数60

4.3.6标准差(StandardDeviation)61

4.3.7方差(Variance)64

4.3.8R语言的summary命令64

4.4数据的图形描述65

4.4.1R语言的plot命令65

4.4.2直方图67

4.4.3条形图68

4.4.4箱线图68

4.5数据框计算69

4.6概率73

4.6.1互斥事件的概率74

4.6.2相互独立事件的概率74

4.6.3非互斥事件概率75

4.6.4概率分布75

4.7小结77

第5章商业分析过程与数据探索79

5.1商业分析过程79

5.1.1第一阶段:理解商业问题79

5.1.2第二阶段:收集和整合数据79

5.1.3第三阶段:预处理数据80

5.1.4第四阶段:探索和可视化数据80

5.1.5第五阶段:选择建模技术和算法81

5.1.6第六阶段:评估模型81

5.1.7第七阶段:管理和审查报告81

5.1.8第八阶段:部署模型81

5.2理解商业问题82

5.3收集和整合数据82

5.3.1抽样83

5.3.2变量选择84

5.4预处理数据85

5.4.1数据类型85

5.4.2数据准备86

5.4.3使用R语言进行数据预处理87

5.5数据探索和数据可视化91

5.5.1表格92

5.5.2汇总表92

5.5.3图形93

5.5.4散点图矩阵97

5.5.5数据转换101

5.6使用建模技术和算法102

5.6.1描述性分析103

5.6.2预测分析103

5.6.3机器学习103

5.7评估模型106

5.7.1训练数据分区106

5.7.2测试数据分区106

5.7.3验证数据分区107

5.7.4交叉验证107

5.7.5分类模型评估108

5.7.6回归模型评估111

5.8提交管理报告和审查112

5.8.1描述问题112

5.8.2使用的数据集112

5.8.3执行数据清洗112

5.8.4创建模型的方法112

5.8.5模型部署前提条件113

5.8.6模型部署和使用113

5.8.7问题处理113

5.9部署模型113

5.10小结114

第6章监督机器学习:分类115

6.1什么是分类?什么是预测?115

6.2概率分类器模型116

6.2.1示例117

6.2.2R语言朴素贝叶斯分类器118

6.2.3朴素贝叶斯分类器的优点和局限性119

6.3决策树120

6.3.1递归分割决策树算法121

6.3.2信息增益121

6.3.3决策树示例123

6.3.4决策树归纳124

6.3.5树分类规则127

6.3.6过拟合和欠拟合127

6.3.7偏差和方差(BiasandVariance)128

6.3.8避免过拟合误差和确定决策树生长的规模129

6.4其他分类器类型131

6.4.1K-最近邻131

6.4.2随机森林132

6.5R语言分类示例134

6.6小结138

第7章无监督机器学习139

7.1聚类概述139

7.2什么是聚类140

7.2.1两个记录之间的测量方法141

7.2.2分类变量的距离度量142

7.2.3混合型数据的距离度量142

7.2.4两个聚类之间的距离143

7.3层次聚类145

7.3.1树状图145

7.3.2层次聚类的局限性145

7.4非层次聚类146

7.4.1k-means算法146

7.4.2k-means聚类的局限性147

7.5聚类案例研究148

7.5.1仅保留数据集中的相关变量149

7.5.2从数据集中删除任何异常值149

7.5.3数据归一化(StandardizetheData)150

7.5.4计算数据点之间的距离150

7.6关联规则157

7.6.1选择规则158

7.6.2关联规则生成示例160

7.6.3解读结果161

7.7小结162

第8章简单线性回归分析163

8.1概述163

8.2相关性164

8.3假设检验167

8.4简单线性回归分析168

8.4.1回归假设168

8.4.2简单线性回归方程168

8.4.3R语言创建简单回归方程169

8.4.4检验回归假设171

8.4.5结论176

8.4.6预测响应变量176

8.4.7补充说明177

8.5小结178

第9章多元线性回归分析179

9.1使用多元线性回归分析180

9.1.1数据181

9.1.2相关性181

9.1.3构建模型182

9.1.4验证回归假设184

9.1.5多重共线性188

9.1.6逐步多元线性回归分析190

9.1.7全子集多元线性回归分析191

9.1.8多元线性回归方程193

9.1.9结论193

9.2R语言的替代方法193

9.3预测响应变量194

9.4训练和测试模型195

9.5交叉验证196

9.6小结198

第10章逻辑回归分析201

10.1逻辑回归202

10.1.1数据203

10.1.2构建模型204

10.1.3模型拟合验证207

10.1.4一般注意事项208

10.1.5多重共线性208

10.1.6离散209

10.1.7逻辑回归分析结论209

10.2模型训练和测试209

10.2.1预测响应变量211

10.2.2验证逻辑回归模型的其他替代方法212

10.3多项逻辑回归分析213

10.4正则化214

10.5小结220

第11章大数据分析:介绍及未来趋势221

11.1大数据生态系统222

11.2大数据分析的未来趋势225

11.2.1发展壮大的社交媒体225

11.2.2创建数据湖225

11.2.3企业用户手中的可视化工具225

11.2.4规范性分析225

11.2.5物联网226

11.2.6人工智能226

11.2.7全数据处理226

11.2.8数据垂直应用和横向应用226

11.2.9实时分析226

11.2.10将数据分析工具交由企业用户使用227

11.2.11将解决方案从一个工具迁移到另一个工具227

11.2.12云无处不在227

11.2.13数据库内分析227

11.2.14内存分析228

11.2.15机器学习的自主服务228

11.2.16安全和合规性228

11.2.17医疗保健228

引用95

第4章制作自动机器车97

自动系统介绍97

介绍移动机器人99

搭建机器车100

DIY机器人平台100

集成的机器人平台102

使用PololuZumorobotforArduino104

用计算机控制机器车109

使用GPS模块导航117

介绍地图引擎平台124

制作基于GPS的小车128

制作自动机器车130

总结131

引用131

第5章在物联网项目中添加语音技术133

语音技术介绍133

声音传感器和驱动器介绍134

语音技术的模式识别介绍143

介绍语音和声音模块143

为物联网项目增加语音控制145

设置EasyVRshield3145

创建语音命令148

给语音板布线151

编写Sketch程序151

测试157

让IoT板说话157

设置157

布线157

编写Sketch程序158

测试159

让RaspberryPi说话159

设置159

编写Python程序162

下一步是什么?163

总结163

引用163

第6章为物联网项目搭建数据云165

对云技术的介绍165

介绍基于云的数据科学166

连接IoT板到云服务器167

微软AzureIoT167

亚马逊AWSIoT168

Arduino云168

使用微软AzureIoTHub180

设置微软AzureIoTHub180

注册IoT设备182

编写程序186

构建科学型云平台192

部署Azure机器学习193

发布到AzureML作为Web服务194

构建带有科学型数据云的IoT应用196

总结196

引用197

前言/序言

近几年来,随着计算机和新一代信息技术的蓬勃发展,商业大数据也呈爆炸性增长。在商业领域,各个行业、企业或组织都遇到了前所未有的全球化、区域化或细分市场多元化的挑战和机遇,他们在激烈竞争中对生存和成长的需求推动了对大数据发展的探索和研究。有效地处理、分析和应用这些大数据解决商业问题,已成为当今各个商业领域的迫切需求,相应地也使商业分析师变得倍受欢迎。

有志于涉足商业分析的读者,将会从《R语言商业分析实战》中获益匪浅。《R语言商业分析实战》最显著的特点是以丰富的案例阐述、解释和演示商业分析涉及的理论和技术,虽然涉及R语言、数学和统计学理论,但并不晦涩难懂。《R语言商业分析实战》列举了数据分析在许多应用场景和商业分析中的案例,探讨了商业分析师所需的技能和商业分析项目的过程,并且以R语言作为演示《R语言商业分析实战》当中概念的一种统计工具,通过详实的案例讲述了如何编写R语言程序处理数据、分析模型的构建以及从中吸取有益的推论。同时,阐述了数据挖掘及其相关技术,也揭示了机器学习的基本概念和生成预测建模,最后还讲述了如何定义商业问题及提出相关的解决方案。

R语言商业分析实战》将有助于读者了解当前行业、企业或组织中所面临的具体商业问题,以及学习采取哪些相应的措施去分析和解决读者所研究的商业问题。书中还包含了一些重要的商业分析技术的学习案例,如分类、关联、聚类以及回归分析等。读者可以根据商业需求选择不同的方法和技术去解决实际商业问题。如果读者对商业分析感兴趣,这就是一本具有实战指导意义的书籍。

除王胜夏、杨莉灵和秦双夏之外,参与《R语言商业分析实战》翻译的还有吴骅、罗平章、李远明、王学昌、周娟、刘红军、王玲、郑正正、莫鸿强等人,感谢这些同行对《R语言商业分析实战》的辛勤付出。由于水平有限,译文中的不当之处在所难免,恳请各位同行和读者朋友不吝赐教。


其他推荐