编辑推荐

对于认真拥抱大数据机遇的人而言,这是一本必读书。

内容简介

这是一本博大精深但又不太技术的指南,向你介绍数据科学的基本原则,并带领你全程浏览从所搜集数据中抽取有用知识和商业价值所必需的“数据分析思维”。通过学习数据科学原则,你将领略当今用到的诸多数据挖掘技巧。更重要的是,这些原则支撑着通过数据挖掘技巧解决商业问题所需的手段和策略。

精彩书评

“《商业数据科学(影印版)》chaoyue了数据分析基础。这是为我们中的一部分人(也许是全部)准备的重要指南,他们的业务基于无处不在的数据机遇和数据驱动决策的新体制而设。”
——TomPhillips(DstilleryCEO,前Google搜索和分析业务主管)


“两位作者早在‘数据科学’这个名词出现之前就是该领域的知名专家,他们拿下了一个复杂的主题并且将它变得晓畅通俗。这是第1本此类著作,专注于将数据科学概念应用于实际的商业问题。它被自由地挥洒在引人注目的现实世界的例子中,概述了商业世界中熟悉而易于获取的问题:客户流失、有针对性的营销,甚至是威士忌分析!
这《商业数据科学(影印版)》是独yi无er的,因为它不是给出算法的详细指南,而是帮助读者理解数据科学背后的基本概念,重要的是如何在解决问题时取得成功。无论您正在寻找数据科学的全面综述,还是需要基础知识的新兴数据科学家,这《商业数据科学(影印版)》都是必读的。”
——ChrisVolinsky(AT&T实验室统计研究总监,奖金达百万美元的Netflix挑战赛获奖者)


“数据是生产力增长、创新和更丰富的客户洞察力新浪潮的基础。直到最近才被广泛地视为竞争优势的来源,处理好数据正在迅速成为停留在游戏中的筹码。作者的深刻应用经验成为观察你的竞争对手策略的一个窗口。”
——AlanMurray(连续创业者,CoriolisVentures合伙人)


目录

Preface
1.Introduction:Data-AnalyticThinking
TheUbiquityofDataOpportunities
Example:HurricaneFrances
Example:PredictingCustomerChurn
DataScience,Engineering,andData-DrivenDecisionMaking
DataProcessingand"BigData"
FromBigData1.0toBigData2.0
DataandDataScienceCapabilityasaStrategicAsset
Data-AnalyticThinking
ThisBook
DataMiningandDataScience,Revisited
ChemistryIsNotAboutTestTubes:DataScienceVersustheWorkoftheDataScientist
Summary

2.BusinessProblemsandDataScienceSolutions
FromBusinessProblemstoDataMiningTasks
SupervisedVersusUnsupervisedMethods
DataMiningandItsResults
TheDataMiningProcess
BusinessUnderstanding
DataUnderstanding
DataPreparation
Modeling
Evaluation
Deployment
ImplicationsforManagingtheDataScienceTeam
OtherAnalyticsTechniquesandTechnologies
Statistics
DatabaseQuerying
DataWarehousing
RegressionAnalysis
MachineLearningandDataMining
AnsweringBusinessQuestionswithTheseTechniques
Summary

3.IntroductiontoPredictiveModeling:FromCorrelationtoSupervisedSegmentation.
Models,Induction,andPrediction
SupervisedSegmentation
SelectingInformativeAttributes
Example:AttributeSelectionwithInformationGain
SupervisedSegmentationwithTree-StructuredModels
VisualizingSegmentations
TreesasSetsofRules
ProbabilityEstimation
Example:AddressingtheChurnProblemwithTreeInduction
Summary

4.FittingaModeltoData
ClassificationviaMathematicalFunctions
LinearDiscriminantFunctions
OptimizinganObjectiveFunction
AnExampleofMiningaLinearDiscriminantfromData
LinearDiscriminantFunctionsforScoringandRankingInstances
SupportVectorMachines,Briefly
RegressionviaMathematicalFunctions
ClassProbabilityEstimationandLogistic"Regression"
LogisticRegression:SomeTechnicalDetails
Example:LogisticRegressionversusTreeInduction
NonlinearFunctions,SupportVectorMachines,andNeuralNetworks

5.OverfittingandItsAvoidance
6.Similarity,Neighbors,andClusters
7.DecisionAnalyticThinkinghWhatIsaGoodModel?
8.VisualizingModelPerformance
9.EvidenceandProbabilities
10.RepresentingandMiningText
11.DecisionAnalyticThinkingIhTowardAnalyticalEngineering
12.OtherDataScienceTasksandTechniques
13.DataScienceandBusinessStrategy
14.Conclusion
A.ProposalReviewGuide
B.AnotherSampleProposal
Glossary
Bibliography
Index

其他推荐