本书介绍的概念和技能可以帮助你解决现实世界的数据分析挑战。它涵盖概率、统计推断、线性回归和机器学习等概念。它还可以帮助你培养诸如R编程、数据整理、数据可视化、预测算法构建、使用Unix/Linux框架(shell)组织文件、使用Git和GitHub进行版本控制,以及可复现文档准备等技能。
作者通过案例研究,真实地模仿了数据科学家的经验。他首先提出具体的问题,然后通过数据分析来回答这些问题,因此,概念的介绍是在回答问题的过程中进行的。涉及的案例研究数据包括:美国各州的枪杀率、学生报告的身高、世界卫生和经济趋势、疫苗对传染病率的影响、2007—2008年的金融危机、美国总统选举预测、组建棒球队、手写数字的图像处理和电影推荐系统等相关数据。
本书可用于数据科学基础课。阅读本书不需要具备R语言的知识,尽管有一些编程经验可能更有帮助。
本书介绍可以帮助读者处理真实数据分析挑战的概念和技能。它涵盖了概率论、统计推断、线性回归和机器学习等概念。它还帮助读者提升如下技能:R编程、数据清洗、数据可视化、预测算法构建、使用UNIX/Linux shell组织文件、使用Git和GitHub进行版本控制以及可复制的文档准备。全书分为六个部分,分别为R、数据可视化、统计与R、数据清洗、机器学习和生产力工具。
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录