内容简介
《SQL Server数据挖掘与商业智能基础及案例实战》全面介绍了数据挖掘与商业智能的基本概念与原理,包括经典理论与趋势发展,并深入叙述了各种数据挖掘的技术与典型应用。通过《SQL Server数据挖掘与商业智能基础及案例实战》的学习,读者可以对数据挖掘与商业智能的整体结构、概念、原理、技术和发展有深入的了解和认识。《SQL Server数据挖掘与商业智能基础及案例实战》以MicrosoftSQLServer2014(适用于2012)的数据挖掘模块进行介绍,让读者可以很快地通过书中的说明与范例,在极短的时间内就能上手。《SQL Server数据挖掘与商业智能基础及案例实战》分为四个部分:第一部分介绍数据仓库、数据挖掘与商业智能之间的关系。第二部分对MicrosoftSQLServer的整体架构进行了介绍,并详细阐述了直接与数据挖掘相关的两个服务:分析服务和报表服务。第三部分逐一阐述了MicrosoftSQLServer中包含的九种数据挖掘模型。第四部分提供了四个数据挖掘的案例以及数据挖掘模型的评估,通过模仿练习,读者可获得实际的数据挖掘经验,稍加修改就能在自己所处的领域中加以应用。
目录
PARTI数据仓库、数据挖掘与商业智能Chapter1绪论2
1-1商业智能3
1-2数据挖掘7
Chapter2数据仓库9
2-1数据仓库定义10
2-2数据仓库特性10
2-3数据仓库架构11
2-4创建数据仓库的目的12
2-5数据仓库的运用14
2-6数据仓库的管理14
Chapter3数据挖掘简介16
3-1数据挖掘的定义17
3-2数据挖掘的重要性17
3-3数据挖掘的功能17
3-4数据挖掘的步骤18
3-5数据挖掘建模的标准CRISP-DM19
3-6数据挖掘的应用21
3-7数据挖掘软件介绍22
Chapter4数据挖掘的主要方法24
4-1回归分析25
4-2关联规则27
4-3聚类分析27
4-4判别分析29
4-5神经网络29
4-6决策树31
4-7其他分析方法32
Chapter5数据挖掘与相关领域的关系34
5-1数据挖掘与统计分析35
5-2数据挖掘与数据仓库35
5-3数据挖掘与KDD36
5-4数据挖掘与OLAP37
5-5数据挖掘与机器学习37
5-6数据挖掘与Web数据挖掘38PARTIIMicrosoftSQLServer概述Chapter6MicrosoftSQLServer中的商业智能40
6-1MicrosoftSQLServer入门41
6-2关系数据仓库41
6-3SQLServer2008R2概述42
6-4SQLServer2008R2技术43
6-5SQLServer2008R2新增功能45
Chapter7MicrosoftSQLServer中的数据挖掘功能46
7-1创建商业智能应用程序47
7-2MicrosoftSQLServer数据挖掘功能的优势48
7-3MicrosoftSQLServer数据挖掘算法50
7-4MicrosoftSQLServer可扩展性51
7-5MicrosoftSQLServer是数据挖掘与商业智能的结合51
7-6使用数据挖掘可以解决的问题52
Chapter8MicrosoftSQLServer的分析服务(AnalysisServices)56
8-1创建多维数据集的结构57
8-2建立和部署多维数据集58
8-3从模板创建自定义的数据库58
8-4统一维度模型59
8-5基于属性的维度59
8-6维度类型60
8-7量度组和数据视图61
8-8计算效率62
8-9MDX脚本62
8-10存储过程63
8-11关键绩效指标(KPI)64
8-12实时商业智能64
Chapter9MicrosoftSQLServer的报表服务(ReportingServices)66
9-1为何使用报表服务67
9-2报表服务的功能67
Chapter10MicrosoftSQLServer的整合服务71
10-1SSIS介绍72
10-2操作示例79
Chapter11MicrosoftSQLServer的DMX语言100
11-1DMX语言介绍101
11-2DMX函数102
11-3DMX语法107
11-4DMX操作实例115PARTIIIMicrosoftSQLServer中的数据挖掘模型Chapter12决策树模型122
12-1基本概念123
12-2决策树与判别函数123
12-3计算方法124
12-4操作范例126
Chapter13贝叶斯分类器134
13-1基本概念135
13-2操作范例137
Chapter14关联规则147
14-1基本概念148
14-2关联规则的种类149
14-3关联规则的算法:Apriori算法149
14-4操作范例150
Chapter15聚类分析160
15-1基本概念161
15-2层级聚类法与动态聚类法161
15-3操作范例166
Chapter16时序聚类176
16-1基本概念177
16-2主要算法177
16-3操作示例179
Chapter17线性回归模型187
17-1基本概念188
17-2一元回归模型189
17-3多元回归模型192
17-4操作范例195
Chapter18逻辑回归模型203
18-1基本概念204
18-2logit变换与logistic分布204
18-3逻辑回归模型206
18-4操作范例207
Chapter19人工神经网络模型215
19-1基本概念216
19-2神经网络模型的特点217
19-3神经网络模型的优劣比较218
19-4操作范例220
Chapter20时序模型228
20-1基本概念229
20-2时序的构成231
20-3简单时序的预测237
20-4包含趋势与季节成份的时序预测238
20-5参数化的时序预测模型240
20-6操作范例243PARTIVMicrosoftSQLServer数据挖掘应用实例Chapter21决策树模型实例253
Chapter22逻辑回归模型实例260
22-1回归模型实例一261
22-2回归模型实例二266
22-3回归模型实例三270
Chapter23神经网络模型实例275
23-1神经网络模型实例一276
23-2神经网络模型实例二281
Chapter24时序模型实例292
24-1时序模型实例一293
24-2时序模型实例二297
Chapter25如何评估数据挖掘模型303
25-1评估图节点介绍EvaluationChartNode304
25-2在SQLServer中如何评估模型307
25-3规则度量:支持度与可信度311
精彩书摘
《SQLServer数据挖掘与商业智能基础及案例实战》:
开发数据挖掘模型的最佳人选是同时具备业务和技术技巧的人员。模型的开发人员将会从其统计背景中获益、了解企业面临的关键业务问题、对数据和关系产生极大的好奇心,同时还能够利用MicrosoftSQLServer工具处理和存储数据。现有数据仓库小组中的成员最有可能遇到这些标准。
作为数据挖掘的初学者,应在构建原型模型的同时,计划花费数周时间来研究数据、工具以及可供选择的算法。使用一台具备数据库管理权限的开发服务器。构建模型的最初阶段是探索阶段:用户可能会希望以不同的方法来重新构建数据和实验。当然,用户肯定希望从少量数据子集开始,并在开发愈加清晰的模型设计时扩展数据集。在原型阶段,不要为如何构建一个“可供生产使用”的应用程序而担心。使用DTS或执行任何所需数据处理最为舒适的工具。保存一份记录有必要转换的高级日志,但不要期望所做的一切都能成为永久应用程序的一部分。
用户应当准备两套数据:一套用于开发模型,另一套用于测试模型的精确度,从中选择适合业务问题的最佳模型。在考虑如何划分数据子集时,要确保没有引入任何偏差。例如,从十个客户中选择一个客户,或根据姓氏的第一个字符区分,或根据其他任意属性区分。
……