编辑推荐

适读人群:有一定数学基础,希望了解、学习数据分析技术,并将其运用到实际工作生活中的学生和社会工作者。

深入浅出的统计理论基础

63个鲜活的生活实例

帮助读者建立统计理论知识框架,形成数据分析思维逻辑,学会数据分析方法

内容简介

数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的zui有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。

人人都会数据分析:从生活实例学统计》系统地介绍了数据分析的统计理论基础内容,共5章。第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析的,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形的功能及使用场景。

人人都会数据分析:从生活实例学统计》以数据分析的统计理论基础为主题,大多数知识点都列举了生活中的实用案例,适合高等院校学生、公司职员、个体商户和企业管理者学习参考。《游戏数据分析实战》的特色是以详细案例为主,通过SPSS、Excel等工具逐步展示实施步骤。通过手把手的方式让读者快速掌握游戏数据分析方法。

作者简介

谢运恩

微信公众号“SPSS生活统计学”创建者,资深数据分析师,拥有多年的统计教育和数据分析咨询经验,尤其擅长数据分析技术在传统行业的落地实施。

李安富

微信公众号“SPSS生活统计学”创建者,国内知名大学统计学专业教师,资深数据分析师,擅长将枯燥无味的统计公式用诙谐幽默的方式教授给学生。

目录

第1章

生活在数据时代

1.1数据分析无处不在

1.1.1常用的国家统计指标

1.1.2制造业的数据分析应用

1.1.3营销领域的数据分析应用

1.1.4医疗行业的数据分析应用

1.2人人都能成为数据分析师

1.2.1数据分析过程

1.2.2数据分析工具

1.2.3数据分析师的成长之路

第2章

耳熟能详的数据你真的了解吗

2.1数据的类型

2.1.1数据的结构属性分类

2.1.2数据的连续性特征分类

2.1.3数据的测量尺度分类

2.2数据描述的三个维度

2.3数据的集中趋势描述

2.3.1算术平均值

生活案例:使用算术平均值了解公司的待遇水平

2.3.2几何平均值

生活案例:使用几何平均数识别生产线上的隐形损耗

2.3.3众数

生活案例:使用众数制订服装企业的生产计划

2.3.4中位数

生活案例:使用中位数识破招聘启事的工资陷阱

2.4数据的离散程度描述

2.4.1极差

生活案例:使用极差描述气温的变化幅度

2.4.2平均偏差

生活案例:使用平均偏差评价生产线的稳定性

2.4.3方差和标准差

生活案例:使用标准差(方差)提高巧克力生产线的工艺水平

2.4.4变异系数

生活案例:使用变异系数客观评定员工绩效

2.4.5四分位极差

2.5数据的分布形态描述

2.5.1概率

生活案例:概率是赌场老板制定游戏规则的法宝

2.5.2概率分布

2.5.3离散型概率分布:二项分布

生活案例:产品抽检的二项分布应用

2.5.4离散型概率分布:多项分布

生活案例:预测足球比赛结果的多项分布应用

2.5.5离散型概率分布:超几何分布

生活案例:超市抽奖活动的超几何分布概率

2.5.6离散型概率分布:泊松分布

生活案例:使用泊松分布进行杂货店的库存管理

生活案例:使用二项分布和泊松分布分析准备的试卷数量是否足够

2.5.7连续型概率分布:指数分布

生活案例:指数分布告诉你,为什么电子产品只保修三年

2.5.8连续型概率分布:均匀分布

生活案例:使用均匀分布分析家具物流的送货时间

2.5.9连续型概率分布:正态分布

生活案例:使用正态分布分析研究生毕业论文的完成时间

生活案例:使用峰度与偏度检验政府精准扶贫效果

2.5.10正态分布作为二项分布近似

生活案例:使用正态分布和二项分布分析足球比赛的猜边概率

2.5.11正态分布作为泊松分布近似

生活案例:使用正态分布和泊松分布分析民营电缆厂的良品率

第3章

数据分析的“内核”:推断分析

3.1见微知著的抽样

3.1.1抽样的意义

3.1.2抽样方法

3.1.3样本推断的理论基础

3.2数据的处理

3.2.1数据处理的不良案例

3.2.2正确的数据存储形式

3.3样本到总体的桥梁:抽样分布

3.3.1抽样分布的定义

3.3.2Z分布

3.3.3T分布

3.3.4切比雪夫定理

3.3.5卡方分布

3.3.6F分布

3.4数据分析的第一板“斧”:参数估计

3.4.1参数估计的类型

3.4.2Z分布与总体均值的区间估计

生活案例:估算西部儿童看电视时间的置信区间

生活案例:估算大学生每日体育锻炼时间的置信区间

生活案例:购买保险公司产品的消费者年龄置信区间

3.4.3T分布与总体均值的区间估计

生活案例:酱料厂罐装产品重量的置信区间

3.4.4切比雪夫定理与总体均值的区间估计

生活案例:心脏搭桥手术后,患者住院时间的置信区间

3.4.5卡方分布与总体方差的区间估计

生活案例:使用T分布和Z分布分析食品包装上的营养成分表

3.4.6F分布与两个总体方差比的区间估计

生活案例:比较不同超市的电子秤精度

3.4.7两个总体均值差的区间估计

生活案例:比较水稻新品种在不同地区的产量

生活案例:比较不同睡眠时间对记忆力的影响

生活案例:研究新药对睡眠质量的影响

生活案例:比较两家航空公司的起飞延误时间

生活案例:蒲公英的降脂作用

3.4.8总体比率的区间估计

生活案例:移动支付的普及程度调查

3.4.9样本容量的确定

生活案例:管理制药厂的供应商

生活案例:出口苹果的重量控制

生活案例:电视节目的收视率调查

3.5数据分析的第二板“斧”:假设检验

3.5.1假设检验的理论基础

3.5.2单样本的假设检验

生活案例:使用单样本Z检验分析笔记本电池的续航能力改进效果

生活案例:使用单样本T检验分析新型麻醉剂的麻醉效果

生活案例:使用卡方检验管理饮料工厂的产品质量

3.5.3两样本的假设检验

生活案例:机场对不同航空公司航班的起飞时间管理

生活案例:新药的临床实验

生活案例:新药的副作用研究

生活案例:自动化生产线的工艺调整

3.5.4多样本的假设检验与方差分析

生活案例:使用单因素方差分析研究新水稻品种的性状

生活案例:使用无交互两因素方差分析研究员工的绩效管理方式

生活案例:使用有交互两因素方差分析研究员工绩效的管理方式

3.6数据分析的第三板“斧”:非参数检验

3.6.1非参数检验

3.6.2卡方检验

生活案例:使用卡方检验分析讲座的到场人数是否存在异常波动

生活案例:使用卡方检验分析不同年龄人群对汽车颜色的喜好

3.6.3Wilcoxon符号秩检验

生活案例:使用Wilcoxon符号秩检验分析职业影评人的打分差异

第4章

数据分析的终极目的:“为我所用”

4.1“相关”是继续分析的前提

4.1.1相关关系

4.1.2相关分析

生活案例:使用相关分析理解“总理指数”

生活案例:使用偏相关分析研究上网时间是否真的影响学习成绩

生活案例:使用距离相关分析研究汽车的性价比

4.2“回归”是相关分析的归宿

4.2.1回归分析综述

4.2.2简单线性回归分析

生活案例:简单线性回归分析用于货运总量预测国内生产总值

生活案例:货运总量预测国内生产总值的置信区间

生活案例:货运总量与国内生产总值回归模型的效果检验

4.2.3多元线性回归分析

生活案例:使用多元线性回归分析优化快递业务员的路线

4.3发现事物随时间变化的规律

4.3.1时间序列分析综述

4.3.2长期趋势分析

生活案例:使用移动平均法预测玩具公司的销售量

生活案例:使用加权移动平均法预测玩具公司的销售量

生活案例:使用指数平滑法预测玩具公司的销售量

生活案例:使用指数平滑法预测玩具公司的销售量

生活案例:使用回归方程法预测创业公司的销售额

4.3.3季节变动趋势分析

生活案例:创业公司销售额的季节变动趋势分析

4.3.4循环变动和不规则变动

生活案例:公司销售量的循环变动分析

4.3.5时间序列分析应用

第5章

给数据披上靓丽“外衣”:数据可视化

5.1数据的可视化

5.1.1数据可视化工具

5.1.2常用的统计图

5.2条形图、直方图和饼图

5.2.1条形图

5.2.2直方图

5.2.3饼图

5.3线图与面积图

5.3.1线图

5.3.2面积图

5.4散点图

5.5高低图与箱线图

5.5.1高低图

5.5.2箱线图

5.6时间序列图

5.7帕累托图

5.8P-P概率图和Q-Q概率图

5.8.1P-P概率图

5.8.2Q-Q概率图

前言/序言

人人都应该会数据分析

数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。很多人认为数据分析能力就是对数据进行描述和做出漂亮的统计图形的能力,这是狭隘的理解。数据分析能力的基础在于数据分析的逻辑思维能力,而逻辑思维能力的培养必须建立在统计理论基础之上。

统计学是数据分析的基础

在移动互联网时代,信息的获取成本越来越低,这也导致拿来主义和实用主义盛行。数据分析科学是一门需要紧密联系生活实际的科学。数据分析方法非常多,这是因为不同的数据分析环境需要选择不同的数据分析方法来处理。因此,在数据和数据分析方法之间,天然地存在鸿沟,拿来主义和实用主义经常行不通,而磨平鸿沟的方法就是学习统计理论基础。

笔者接触过很多希望学习数据分析或正在学习数据分析的朋友,发现他们身上都有一个通病,就是将学习各种分析软件作为学习重点,觉得学习数据分析就是学习分析软件操作。他们在进行具体的数据分析时,通常的做法是套用别人的数据分析逻辑和方法,如果分析结果与参考结果一致,那么没有问题,但是通常的情况是不一致的,这时他们就需要浪费大量的时间和精力查找原因。而不一致的原因通常是数据情况不符合导致的,解决的办法是根据实际的数据分析环境进行数据调整或选择其他合适的数据分析方法,而要做到这些,归根结底需要的还是扎实的统计理论基础。

学习数据分析应该以统计理论基础为主线,分析软件仅仅是各种分析方法的实现工具。因此,在开始学习时,应该辅以一到两种操作简便的分析软件,例如SPSS。这样就能够比较快速地建立统计理论框架,并掌握一款分析软件。当你的统计理论基础夯实以后,会发现学习各种分析软件都能够游刃有余,甚至像R和Python这种编程语言也能在比较短的时间内掌握。

从生活实例中开始学统计学

标准版的统计教材往往偏重于理论推导,描述语言专业严谨,这不可避免地带来了晦涩难懂的问题。《人人都会数据分析:从生活实例学统计》的写作初衷就是为了解决没有任何统计基础的各行各业的数据分析学习者,他们学习和构建自己统计理论基础的需求,大部分知识点都列举了生活中的应用案例,能够帮助学习者更好地理解和掌握各个知识点的分析逻辑,并内化为自己的统计理论基础的知识框架。

除此之外,《人人都会数据分析:从生活实例学统计》在章节设计上做了精心的安排,共包括5章内容。

第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径。

第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据。

第3章为推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征。

第4章为预测分析内容,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息。

第5章是数据结果可视化的内容,包括各种统计图形的功能及使用场景。

“不积跬步,无以至千里”,夯实基础的过程总是比较乏味的,希望《人人都会数据分析:从生活实例学统计》通俗的描述语言和鲜活的生活应用案例能够帮助数据分析学习者顺利建立统计理论的知识框架,形成数据分析思维逻辑,成为各自领域的佼佼者。

作者


其他推荐