编辑推荐

学习如何利用R语言洞察、知晓、理解原始数据。《数据科学:R语言实现(影印版 英文版)》介绍了R、RStudio以及tidyverse,后者是一组相互配合工作的R包,能够使数据科学更快速、流畅、富有乐趣。《数据科学:R语言实现(影印版 英文版)》旨在帮助你尽快地上手数据科学相关的工作,并不要求读者先前具备编程经验。
作者HadleyWickham和GarrettGrolemund将一步步指导你对数据进行导入、提炼、探索以及建模并发布成果。除了处理数据所需的基本工具,你还将会对数据科学的周期拥有一个完整的、宏观的理解。

内容简介

  学习如何利用R语言洞察、知晓、理解原始数据。
  《数据科学:R语言实现(影印版英文版)》介绍了R、RStudio以及tidyverse,后者是一组相互配合工作的R包,能够使数据科学快速、流畅、富有乐趣。
  《数据科学:R语言实现(影印版英文版)》旨在帮助你尽快地上手数据科学相关的工作,并不要求读者具备编程经验。
  《数据科学:R语言实现(影印版英文版)》HadleyWickham和GarrettGrolernund将一步步指导你对数据进行导入、提炼、探索以及建模并发布成果。除了处理数据所需的基本工具,你还将会对数据科学的周期拥有一个完整的、宏观的理解。

作者简介

HadleyWickham是RStudio的首席科学家以及R基金会成员。他构建了一套使数据科学变得更加快捷、富有乐趣的工具。可以通过其个人网站了解更多的信息:http://hadley.nz。

GarrettGrolemund是一名统计学家、教师以及RStudio的硕士生导师。他还是《Hands-OnProgrammingwithR》(O'Reilly)一书的作者。Garrett的很多授课视频可以在oreilly.com/safari上找到。

精彩书评

“HadleyWickham是数据科学领域的一位传奇人物,他创造出了一套之前无人想到过的进行数据分析的全新方法。他这本和GarrettGrolemund合著的新书用代码展示了这种新奇的方法,《数据科学:R语言实现(影印版 英文版)》可谓是数据分析方面的圣经。”——RogerD.Peng(约翰?霍普金斯大学布隆博格公共卫生学院生物统计学教授)

目录

Preface

PartI.Explore
1.DataVisualizationwithggplot2
Introduction
FirstSteps
AestheticMappings
CommonProblems
Facets
GeometricObjects
StatisticalTransformations
PositionAdjustments
CoordinateSystems
TheLayeredGrammarofGraphics
2.Workflow:Basics
CodingBasics
What'sinaName?
CallingFunctions
3.DataTransformationwithdplyr
Introduction
FilterRowswithfilter()
ArrangeRowswitharrange()
SelectColumnswithselect()
AddNewVariableswithmutate()
GroupedSummarieswithsummarize()
GroupedMutates(andFilters)
4.W0rkfl0w:Scripts
RunningCode
RStudioDiagnostics
5.ExploratoryDataAnalysis
Introduction
Questions
Variation
MissingValues
Covariation
PatternsandModels
ggplot2Calls
LearningMore
6.Workflow:Projects
WhatIsReal?
WhereDoesYourAnalysisLive?
PathsandDirectories
RStudioProjects
Summary

PartII.Wrangle
7.Tibbleswithtibble
Introduction
CreatingTibbles
TibblesVersusdata.frame
InteractingwithOlderCode
8.DataImportwithreadr
Introduction
GettingStarted
ParsingaVector
ParsingaFile
WritingtoaFile
OtherTypesofData
9.TidyDatawithtidyr
Introduction
TidyData
SpreadingandGathering
SeparatingandPull
MissingValues
CaseStudy
NontidyData
10.RelationalDatawithdplyr
Introduction
nycflightsl3
Keys
Mutatingloins
Filteringloins
loinProblems
SetOperations
11.Stringswithstringr
Introduction
StringBasics
MatchingPatternswithRegularExpressions
Tools
OtherTypesofPattern
OtherUsesofRegularExpressions
stringi
12.Factorswithforcats
Introduction
CreatingFactors
GeneralSocialSurvey
ModifyingFactorOrder
ModifyingFactorLevels
13.DatesandTimeswithlubridate
Introduction
CreatingDate/Times
Date-TimeComponents
TimeSpans
TimeZones

PartIII.Program
14.Pipeswithmagrittr
Introduction
PipingAlternatives
WhenNottoUsethePipe
OtherToolsfrommagrittr
15.Functions
Introduction
WhenShouldYouWriteaFunction?
FunctionsAreforHumansandComputers
ConditionalExecution
FunctionArguments
ReturnValues
Environment
16.Vectors
Introduction
VectorBasics
ImportantTypesofAtomicVector
UsingAtomicVectors
RecursiveVectors(Lists)
Attributes
AugmentedVectors
17.Iterationwithpurrr
Introduction
ForLoops
ForLoopVariations
ForLoopsVersusFunctionals
TheMapFunctions
DealingwithFailure
MappingoverMultipleArguments
Walk
OtherPatternsofForLoops

PartIV.Model
18.ModelBasicswithmodelr
Introduction
ASimpleModel
VisualizingModels
FormulasandModelFamilies
MissingValues
OtherModelFamilies
19.ModelBuilding
Introduction
WhyAreLow-QualityDiamondsMoreExpensive?
WhatAffectstheNumberofDailyFlights?
LearningMoreAboutModels
20.ManyModelswithpurrrandbroom
Introduction
gapminder
List-Columns
CreatingList-Columns
SimplifyingList-Columns
MakingTidyDatawithbroom

PartV.Communicate
21.RMarkdown
Introduction
RMarkdownBasics
TextFormattingwithMarkdown
CodeChunks
Troubleshooting
YAMLHeader
LearningMore
22.GraphicsforCommunicationwithggplot2
Introduction
Label
Annotations
Scales
Zooming
Themes
SavingYourPlots
LearningMore
23.RMarkdownFormats
Introduction
OutputOptions
Documents
Notebooks
Presentations
Dashboards
Interactivity
Websites
OtherFormats
LearningMore
24.RMarkdownWorkflow
Index


其他推荐