书海网短评: 本书介绍了数据挖掘的基本概念,包括数据挖掘的常用算法、常用工具、用途和应用场景及应用状况,讲述了常用数据挖掘方法,如分类、聚类、关联规则的概念、思想、典型算法、应用场景等。此外,本书还从实际应用出发,讲解了基于日志的大数据挖掘
第1章数据挖掘概念1.1数据挖掘概述1.1.1什么是数据挖掘1.1.2数据挖掘常用算法概述1.1.3数据挖掘常用工具概述1.2数据探索1.2.1数据概述1.2.2数据质量1.2.3数据预处理1.3数据挖掘的应用1.3.1数据挖掘现状及发展趋势1.3.2数据挖掘需要解决的问题1.3.3数据挖掘的应用场景1.4作业与练习参考文献第2章分类2.1分类概述2.1.1分类的基本概念2.1.2解决分类问题的一般方法2.1.3决策树案例:Web机器人检测2.1.4模型的过分拟合2.2贝叶斯决策与分类器2.2.1规则分类器2.2.2分类中贝叶斯定理的应用2.2.3分类中朴素贝叶斯的应用2.3支持向量机2.3.1最大边缘超平面2.3.2线性支持向量机SVM2.3.3非线性支持向量机SVM2.4分类在实际场景中的应用案例案例一:如何解决文章主题关键字与搜索引擎关键字带来的检索结果差异案例二:甄别新金融交易方式的欺诈行为案例三:在线广告推荐中的分类2.5作业与练习参考文献第3章聚类3.1聚类概述3.1.1聚类的基本概念3.1.2聚类算法3.2聚合分析方法3.2.1欧氏距离3.2.2聚合过程3.2.3聚类树3.2.4聚合分析方法应用例子3.3聚类在实际场景中的应用案例3.4聚类的实现例子3.5作业与练习参考文献第4章关联规则4.1关联规则概述4.1.1经典案例导入4.1.2关联规则的基本概念和定义4.1.3关联规则的分类4.2关联规则的挖掘过程4.2.1知识回顾4.2.2频繁项集产生4.2.3强关联规则4.2.4关联规则评价标准4.3关联规则的Apriori算法4.3.1知识回顾4.3.2Apriori算法的核心思想4.3.3Apriori算法描述4.3.4Apriori算法评价4.3.5Apriori算法改进4.4关联规则的FP-growth算法4.4.1构建FP树4.4.2从FP树中挖掘频繁项集4.5实战:关联规则挖掘实例4.5.1关联规则挖掘技术在国内外的应用现状4.5.2关联规则应用实例4.5.3关联规则在大型超市中应用的步骤4.6作业与练习参考文献第5章综合实战—日志的挖掘与应用5.1日志概念5.1.1日志是什么5.1.2日志能做什么5.2日志处理5.2.1产生日志5.2.2传输日志5.2.3存储日志5.2.4分析日志5.2.5日志规范与标准5.3日志分析原理及工具5.3.1日志分析原理5.3.2日志分析工具5.3.3日志分析系统规划建设5.4日志挖掘应用5.4.1安全运维5.4.2系统健康分析5.4.3用户行为分析5.4.4业务分析设计5.5日志分析挖掘实例5.6作业与练习参考文献第6章数据挖掘应用案例6.1电力行业采用聚类方法进行主变油温分析6.1.1需求背景及采用的大数据分析方法6.1.2大数据分析方法的实现过程6.1.3大数据分析方法的实现结果6.2银行信贷评价6.2.1简介6.2.2神经网络模型6.2.3实证检验6.3指数预测6.3.1金融时间序列概况6.3.2小波消噪6.3.3向量机6.3.4指数预测6.4客户分群的精准智能营销6.4.1挖掘目标6.4.2分析方法和过程6.4.3建模仿真6.5使用WEKA进行房屋定价6.6作业与练习参考文献附录A大数据和人工智能实验环境附录BHadoop环境要求附录C名词解释