内容简介

  《数理统计与数据分析(原书第3版)》将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用。《数理统计与数据分析(原书第3版)》内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、随机变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性最小二乘等。
  《数理统计与数据分析(原书第3版)》用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法。此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力。
  《数理统计与数据分析(原书第3版)》适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考。

作者简介

  JohnA.Rice,在加州大学伯克利分校获得博士学位,并一直任教于该校统计系,现为该校统计学名誉教授。他是美国数理统计学会成员,发表过多篇理论和应用统计学论文,其研究兴趣集中于海量和需要高强度计算的随机数据的分析方法。

目录

第1章概率
1.1引言
1.2样本空间
1.3概率测度
1.4概率计算:计数方法
1.4.1乘法原理.
1.4.2排列与组合
1.5条件概率
1.6独立性
1.7结束语
1.8习题

第2章随机变量
2.1离散随机变量
2.1.1伯努利随机变量
2.1.2二项分布
2.1.3几何分布和负二项分布
2.1.4超几何分布
2.1.5泊松分布
2.2连续随机变量
2.2.1指数密度
2.2.2伽马密度
2.2.3正态分布
2.2.4贝塔密度
2.3随机变量的函数
2.4结束语
2.5习题

第3章联合分布
3.1引言
3.2离散随机变量
3.3连续随机变量
3.4独立随机变量
3.5条件分布
3.5.1离散情形
3.5.2连续情形
3.6联合分布随机变量函数
3.6.1和与商
3.6.2一般情形
3.7极值和顺序统计量
3.8习题

第4章期望
4.1随机变量的期望
4.1.1随机变量函数的期望
4.1.2随机变量线性组合的期望
4.2方差和标准差
4.2.1测量误差模型
4.3协方差和相关
4.4条件期望和预测
4.4.1定义和例子
4.4.2预测
4.5矩生成函数
4.6近似方法
4.7习题

第5章极限定理
5.1引言
5.2大数定律
5.3依分布收敛和中心极限定理
5.4习题

第6章正态分布的导出分布
6.1引言
6.2.2分布、t分布和F分布
6.3样本均值和样本方差
6.4习题

第7章抽样调查
7.1引言
7.2总体参数
7.3简单随机抽样
7.3.1样本均值的期望和方差
7.3.2总体方差的估计
7.3.3X抽样分布的正态近似
7.4比率估计
7.5分层随机抽样
7.5.1引言和记号
7.5.2分层估计的性质
7.5.3分配方法
7.6结束语
7.7习题

第8章参数估计和概率分布拟合
8.1引言
8.2粒子排放量的泊松分布拟合
8.3参数估计
8.4矩方法
8.5最大似然方法
8.5.1多项单元概率的最大似然估计
8.5.2最大似然估计的大样本理论
8.5.3最大似然估计的置信区间
8.6参数估计的贝叶斯方法
8.6.1先验的进一步注释
8.6.2后验的大样本正态近似
8.6.3计算问题
8.7效率和克拉默{拉奥下界
8.7.1例子:负二项分布
8.8充分性
8.8.1因子分解定理
8.8.2拉奥{布莱克韦尔定理
8.9结束语
8.10习题

第9章假设检验和拟合优度评估
9.1引言
9.2奈曼{皮尔逊范式
9.2.1显著性水平的设定和p值概念
9.2.2原假设
9.2.3一致最优势检验
9.3置信区间和假设检验的对偶性
9.4广义似然比检验
9.5多项分布的似然比检验
9.6泊松散布度检验
9.7悬挂根图
9.8概率图
9.9正态性检验
9.10结束语
9.11习题

第10章数据汇总
10.1引言
10.2基于累积分布函数的方法
10.2.1经验累积分布函数
10.2.2生存函数
10.2.3分位数{分位数图
10.3直方图、密度曲线和茎叶图
10.4位置度量
10.4.1算术平均
10.4.2中位数
10.4.3截尾均值
10.4.4M估计.
10.4.5位置估计的比较
10.4.6自助法评估位置度量的变异性
10.5散度度量
10.6箱形图
10.7利用散点图探索关系
10.8结束语
10.9习题

第11章两样本比较
11.1引言
11.2两独立样本比较
11.2.1基于正态分布的方法
11.2.2势
11.2.3非参数方法:曼恩{惠特尼检验
11.2.4贝叶斯方法
11.3配对样本比较
11.3.1基于正态分布的方法
11.3.2非参数方法:符号秩检验
11.3.3例子:测量鱼的汞水平
11.4试验设计
11.4.1乳腺动脉结扎术
11.4.2安慰剂效应
11.4.3拉纳克郡牛奶试验
11.4.4门腔分术
11.4.5FD&CRedNo
11.4.6关于随机化的进一步评注
11.4.7研究生招生的观测研究、混杂和偏见
11.4.8审前调查
11.5结束语
11.6习题

第12章方差分析
12.1引言
12.2单因子试验设计
12.2.1正态理论和F检验
12.2.2多重比较问题
12.2.3非参数方法:克鲁斯卡尔{沃利斯检验
12.3二因子试验设计
12.3.1可加性参数化
12.3.2二因子试验设计的正态理论
12.3.3随机化区组设计
12.3.4非参数方法:弗里德曼检验
12.4结束语
12.5习题

第13章分类数据分析
13.1引言
13.2费舍尔精确检验
13.3卡方齐性检验
13.4卡方独立性检验
13.5配对设计
13.6优势比
13.7结束语
13.8习题

第14章线性最小二乘
14.1引言
14.2简单线性回归
14.2.1估计斜率和截距的统计性质
14.2.2拟合度评估
14.2.3相关和回归
14.3线性最小二乘的矩阵方法
14.4最小二乘估计的统计性质
14.4.1向量值随机变量
14.4.2最小二乘估计的均值和协方差
14.4.3.2的估计
14.4.4残差和标准化残差
14.4.5ˉ的推断
14.5多元线性回归:一个例子
14.6条件推断、无条件推断和自助法
14.7局部线性平滑
14.8结束语
14.9习题
附录A常用分布
附录B表
部分习题答案
参考文献

前言/序言

  前言
  《数理统计与数据分析(原书第3版)》的目标
  这《数理统计与数据分析(原书第3版)》反映了我对第一门统计学课程的认识,而这对很多学生来说可能是最后的统计课程。
  这样的课程应该包括数理统计的一些经典内容(如似然法),以及描述统计学和数据分析的一些内容,特别是图形显示、试验设计和复杂的实际应用。它还应该体现出计算机在统计学中所起的不可或缺的作用。这些主题适当地交织在一起,可以将现代统计学的本质展示给学生。分别讲授两个主题的课程||一个是理论,一个是数据分析,对我来讲似乎有点造作。此外,很多学生仅学习一门统计学课程,而没有时间学习两门或两门以上这方面的课程。
  数据分析与统计实践
  为了将上述主题融合在一起,我一直在努力地撰写一本能够紧密结合统计实践的教科书。只有分析实际数据,才能使我们明白形式理论和通俗数据分析方法所扮演的角色。我围绕着各种问题组织了这《数理统计与数据分析(原书第3版)》,这些问题都需要使用统计方法来解决,此外书中包含很多实际例子,借此引入和介绍理论内容。这样安排的优点是理论构建在寓意深刻的背景内容下,对其逐步补充和加强,与通俗的分析方法结合在一起。我认为,这种方法是适合于统计学的,其历史发展主要是由实践需要来促进的,而不是抽象或美学的思考。同时,我也没有回避学生应该知道的数学内容。
  第3版
  《数理统计与数据分析(原书第3版)》第1版于1988年问世,第2版于1994年出版。尽管《数理统计与数据分析(原书第3版)》基本的目的和结构没有改变,但是新的版本反映了统计学科的发展,尤其是计算方面的革新。
  这一版最显著的变动是对贝叶斯推断的处理。我将最后一章的材料做了迁移,分散于之前的各章中,这是由于很多老师很难讲授到这一章。现在贝叶斯推断首先出现在第3章的条件分布中。然后,在第8章与频率学派方法同步讲解,那里的贝叶斯方法可以非常自然地解决最大似然估计量。第9章假设检验的引言部分现在以贝叶斯公式作为开端,然后再转向奈曼{皮尔逊范式。
  这样做的一个好处是似然比的至关重要性更突出。在应用中,我强调无信息先验,说明频率学派和贝叶斯学派得出的定性结论具有相似性。
  概率论章节新增了基因组学和金融统计的例子。这些材料除了与相应的主题相关外,还可以很自然地强化基本概念。例如,连接函数(copulas)强调了边际分布和联合分布之间的关系。其他变动包括第10章探索性数据分析中散点图和相关系数的介绍,以及第14章中利用局部线性最小二乘进行非参数平滑的简介。本版新增了将近100道习题,主要集中在第7.14章,同时还包括几个新的数据集,有些数据集完全可以用于计算机实验室上机操作。此外,还修改了前面版本中解释含糊不清的一些段落。
  概要
  当然,我们可以从目录中找到完整的大纲,这里,我仅仅强调几点,并指出教师讲授课程时需要取舍的章节内容。
  前6章包含概率论的内容,特别是与统计学密切相关的内容。第1章以非测度论的观点介绍概率论的基本内容,以及初等组合方法。在这一章和其他概率章节中,我尽可能地利用现实世界的例子,而不是使用球与盒子的抽样模型。
  第2章介绍了随机变量的概念。我选择将离散型和连续型随机变量放在一起讨论,而不是把连续情形推迟到以后再进行介绍。本章介绍了几个常见分布。这样安排的好处是它能为后面的章节提供一些讨论和介绍的内容。
  第3章继续讨论随机变量,但是转向联合分布。教师可以跳过雅可比行列式,这不会有损课程的连续性,因为它们很少在《数理统计与数据分析(原书第3版)》的其余部分出现。如果教师乐意之后做些回溯工作,可以在讲解时跳过3.7节极值和顺序统计量的内容。
  期望、方差、协方差、条件期望和矩生成函数共同构成第4章。教师可以跳过条件期望和预测,尤其是没有计划讲解稍后的充分统计量时。这一章之后的部分介绍了±方法(误差传播方法),这个方法多次出现在统计学的章节中。
  第5章在非常严格的假设条件下证明了大数定律和中心极限定理。
  第6章汇编了与正态分布有关的常用分布,以及利用通常的正态随机样本计算所得统计量的抽样分布。我没有在此浪费过多的时间,但确实介绍了统计学章节所必需的知识点,学生很有必要学习这些分布。
  第7章是有关抽样调查的内容,以非常规但比较自然的方式导入统计学的研究议题。很多学生在学习抽样调查内容时感到比较模糊,而恰恰在抽样调查中很自然地提出了一系列比较特殊的具体统计问题。从历史上看,抽样调查涉及了很多重要的统计概念,并可以将其用作传播介质引入在后面的章节中深入介绍的概念和技术,例如:
  作为随机变量的估计量的思想,具有与之相关联的抽样分布。
  偏倚、标准误差和均方误差的概念。
  置信区间和中心极限定理的应用。
  通过研究分层估计量揭示试验设计的概念以及相对效率的概念。
  期望、方差和协方差的计算。
  抽样调查不受欢迎的原因之一是其计算十分令人讨厌。然而,这种讨厌也有其长处,学生可以在这样的计算中得到锻炼。教师可以灵活地掌握介绍本章概念的深度。比率估计和分层部分是可选的,初次讲授时完全可以跳过,或稍后再讲这些概念,这并不影响课程的连续性。
  第8章介绍参数估计,它是由拟合数据的概率律问题引起的,其中介绍了矩方法、最大似然方法和贝叶斯推断方法,同时还介绍了效率的概念,证明了克拉默{拉奥不等式。8.8节介绍了充分性的概念及其一些衍生问题。可以跳过克拉默{拉奥下界和充分性的内容。在我看来,充分性的重要性通常被过度强调了。负二项分布的内容也可以跳过。
  第9章介绍了假设检验及其拟合优度检验的应用,这配合第8章的内容.(这个内容还会在第11章深入讨论。)这里还简要展示了图方法。如果课时有限,教师可以跳过本章最后的9.6节(泊松散布度检验)、9.7节(悬挂根图)和9.9节(正态性检验)。
  第10章介绍了几种描述性方法,其中的很多技术都会在后面的章节中出现。本章强调了图方法的重要性,并介绍了稳健性的概念。将描述性方法放在《数理统计与数据分析(原书第3版)》的后面似乎有点怪异,这样做是因为描述性方法通常有其随机性的一面,三章之后再介绍之可以使学生有足够的基础知识去研究各种汇总统计量的统计行为(例如,中位数的置信区间)。我在讲授课程时,会较早地介绍这部分内容。例如,在抽样调查实验中,我让学生制作抽取样本的箱形图和直方图。教师可以跳过生存函数和危险函数。
  第11章介绍了两样本问题的经典分析方法和非参数方法。假设检验的概念第一次出现在第9章,在此做了更深一步的介绍。本章的末尾讨论了试验设计并解释了观测研究的一些内容。
  前面11章是初级课程的核心,涵盖了估计和假设检验的构造理论、图和描述性方法以及试验设计的内容。
  教师可以自由地选择第12章到第14章的内容。特别地,没有必要按照书中给定的顺序讲解这些章节。
  第12章利用方差分析和非参数技术讨论了单因子和二因子试验设计问题。多重比较问题第一次出现在第11章末,在此进行了深入讨论。
  第13章简单讨论了分类数据分析,介绍了齐性和独立性的似然比检验,并叙述了麦克尼马尔检验。最后,通过前瞻性和回顾性研究的讨论引入了优势比的估计问题。
  第14章讨论了线性最小二乘。首先介绍了简单线性回归,接着利用线性代数讨论了更一般的情形。我选择运用矩阵代数,但尽可能地将其维持在简单和具体层面上,没有超过初级一学期(每学年分为四学期制度中的一学期)课程所讲授的内容。特别地,我没有介绍一般线性模型的几何分析内容,也没有试图将回归和方差分析统一起来。在这一整章中,理论结果伴随着更多基于残差分析的定性数据分析步骤。在本章末,我通过局部线性最小二乘介绍了非参数回归。
  计算机使用和习题解答
  计算是现代统计不可或缺的一部分。它是数据分析的本质,可以帮助我们理清基本概念。我的学生使用开源软件包R,将其安装在自己的计算机上就可以使用。也可以使用其他的软件包,但在这《数理统计与数据分析(原书第3版)》中,我没有讨论其他的软件程序。原书配套的CD内容可从华章网站(www.hzbook.com)下载,其中包括书中涉及的数据。
  这《数理统计与数据分析(原书第3版)》包含大量的习题,从例行的基本概念强化题到具有一定难度的分析题。我认为习题解答,特别是非常规的习题,是非常重要的。
  致谢
  我要感谢很多人,他们直接和间接地促成了第1版面世。RichardOlshen、YosiRinnot、DonaldVlvisaker、LenHa。和DavidLane在教学中使用了早期版本,他们提出很多有益的意见。他们和我自己课堂中的学生提供了很多建设性的意见。助教,尤其是JoanStaniswalis、RogerJohn-son、TerriBittner和PeterKim,解答了很多习题,发现其中的很多错误。很多审稿人给出了有益的建议:RollinBrant,多伦多大学;GeorgeCasella,康奈尔大学;HowardB。Christensen,杨百翰大学;DavidFairley,俄亥俄州立大学;PeterGuttorp,华盛顿大学;HariIyer,科罗拉多州立大学;DouglasG。Kelly,北卡罗来纳大学;ThomasLeonard,威斯康星大学;AlbertS。Paul-son,伦斯勒理工学院;CharlesPeters,休斯敦大学;AndrewRukhin,马萨诸塞大学安默斯特校区;RobertSchaefer,迈阿密大学;RuthWilliams,加州大学圣地亚哥分校。RichardRoyall和W.G。Cumberland热心地提供了第7章抽样调查所使用的数据集。我在休假时有幸在国家标准局度过了愉快的一年,那里的统计学家让我留意到书中其他几个数据集。我深深地感激编辑JohnKimmel,他的耐心、毅力和信念促成这《数理统计与数据分析(原书第3版)》的出版。
  使用过《数理统计与数据分析(原书第3版)》第1版的很多学生和教员给出了坦诚的评论,这极大地影响了第2版的修订。我要特别感谢IanAbramson、EdwardBedrick、JonFrank、RichardGill、RogerJohnson、TorgnyLindvall、MichaelMartin、DebNolan、RogerPinkham、YosiRinott、PhilipStark和BinYu。我要向无意间遗漏的同仁表示道歉。最后,我要感谢AlexKugushev在进行修订时所提供的鼓励和支持,感谢TerriBittner在校正和解答新的习题时所做的细致工作。
  很多人促成了第3版的问世。我想感谢如下这些审稿专家:MartenWegkamp,耶鲁大学;
  AparnaHuzurbazar,新墨西哥大学;LauraBernhofen,克拉克大学;JoeGlaz,康涅狄格大学;MichaelMinnotte,犹他州立大学。我深深地感激很多读者,他们慷慨地花费大量时间指出书中的错误,并提出了很多改善结构安排之类的良好建议。特别地,RogerPinkham发送了很多有益的电子邮件信息,NickCox指出了大量的语法错误。AliceHsiaw详细评述了第7.14章。我还想感谢AniAdhikari、PauloBerata、PatrickBrewer、Sang-HoonChoGierEide、JohnEinmahl、DavidFreedman、RogerJohnson、PaulvanderLaan、PatrickLee、YiLin、JimLinnemann、RasaanMoshesh、EugeneSchuster、DylanSmall、LuisTenorio、RichardDeVeaux和PingZhang。BobStine贡献了金融数据;DianeCook提供了意大利橄榄油的数据;JimAlbert提供了篮球数据集,很漂亮地解释了回归向均值的问题;RainerSachs提供了可爱的染色质分离数据。我要感谢编辑CarolynCrockett坚强的毅力和耐心,使这一版修订的愿望得以实现,还要感谢这个充满活力且高效的工作团队。我要向无意间遗漏其姓名的其他人表示道歉。
  JohnA。Rice


其他推荐