泸西县图书馆“U书快借”平台

编辑推荐

（1）从头到尾了解机器学习模型构建过程的全面指南

（2）演示了R语言中各种概念的实践

（3）含基于R语言的Keras和TensorFlow深度学习模型介绍

（4）讲授如何用 R 语言在 TensorFlow 框架中进行编程，从而让只擅长 R 语言的读者不必费力去学习 Python。

展开

作者简介

　　卡西克·拉玛苏布兰马尼安（Karthik Ramasubramanian）就职于印度创业技术公司Hike Messenger。他一直为零售、电子商务和技术行业解决跨行业的数据科学问题，开发数据驱动的解决方案并进行原型构建。Karthik对整个数据科学生命周期（从探索数据问题，到创建数据科学模型，以及开发各行业相关产品）都具有丰富的经验。
　　
　　阿布舍克·辛格（ Abhishek Singh）领导的数据科学专业团队正在解决粮食安全、网络安全、自然灾害、医疗保健以及更多领域的紧迫问题。他对美国银行的资产进行了压力测试，开发了保险定价模型，并优化了客户的电信体验。他积极参与数据科学分析相关的思想交流、创作、公开演讲、会议和培训。他坚定地支持负责任地使用人工智能来消除偏见，并坚信合理使用AI将使生活更美好。

展开

内容介绍

本书是介绍机器学习技术的综合指南，从基础的统计学原理和R语言编程知识，到核心的机器学习理论和算法分析，以及机器学习模型的评估和改进方法，再到机器学习技术在大数据平台上的应用，书中都有详细介绍。

本书主要在第1版的基础上增加了两个部分：第一个是关于时间序列模型的新章节（第 9 章），这是一个源于统计学的传统主题。第二个新增的章节是深度学习（第 11 章），它是机器学习的一个迅速崛起的子领域。除了增加这两个章节之外，本书中的文本和代码会以一种读者友好的新格式来整体呈现。新版会继续专注于使用流行的统计编程语言 R 来构建用例。对于深度学习这样的主题，我们建议采用 Python 语言来配合 TensorFlow 这样的框架。但是，在第2版中，我们会向读者展示如何在 TensorFlow 中使用 R 语言编程，因此如果读者只熟悉 R，可以暂时无须学习 Python。与第1版一样，我们通过各种实际用例保持了机器学习理论与应用的良好平衡，为读者提供了一个真正全面的机器学习主题集合。

展开

译者序
前言
第1章机器学习和R语言入门
1．1 了解发展历程
1．1．1 统计学习
1．1．2 机器学习
1．1．3 人工智能
1．1．4 数据挖掘
1．1．5 数据科学
1．2 概率与统计
1．2．1 计数和概率的定义
1．2．2 事件和关系
1．2．3 随机性、概率和分布
1．2．4 置信区间和假设检验
1．3 R语言入门
1．3．1 基本组成部分
1．3．2 R语言的数据结构
1．3．3 子集处理
1．3．4 数和Apply系列
1．4 机器学习过程工作流
1．4．1 计划
1．4．2 探索
1．4．3 构建
1．4．4 评估
1．5 其他技术
1．6 小结

第2章数据准备和探索
2．1 规划数据收集
2．1．1 变量类型
2．1．2 数据格式
2．1．3 数据源的类型
2．2 初始数据分析
2．2．1 初步印象
2．2．2 把多个数据源组织到一起
2．2．3 整理数据
2．2．4 补充更多信息
2．2．5 重塑
2．3 探索性数据分析
2．3．1 摘要统计量
2．3．2 矩
2．4 案例研究：信用卡欺诈
2．4．1 数据导入
2．4．2 数据变换
2．4．3 数据探索
2．5 小结

第3章抽样与重抽样技术
3．1 介绍抽样技术
3．2 抽样的术语
3．2．1 样本
3．2．2 抽样分布
3．2．3 总群体的均值和方差
3．2．4 样本均值和方差
3．2．5 汇总的均值和方差
3．2．6 抽样点
3．2．7 抽样误差
3．2．8 抽样率
3．2．9 抽样偏误
……
第4章 R语言里的数据可视化
第5章特征工程
第6章机器学习理论和实践
第7章机器学习模型的评估
第8章模型性能改进
第9章时间序列模型
第10章可扩展机器学习和相关技术
第11章用Keras和Tensorflow进行深度学习

展开