(1)从头到尾了解机器学习模型构建过程的全面指南
(2)演示了R语言中各种概念的实践
(3)含基于R语言的Keras和TensorFlow深度学习模型介绍
(4)讲授如何用 R 语言在 TensorFlow 框架中进行编程,从而让只擅长 R 语言的读者不必费力去学习 Python。
本书是介绍机器学习技术的综合指南,从基础的统计学原理和R语言编程知识,到核心的机器学习理论和算法分析,以及机器学习模型的评估和改进方法,再到机器学习技术在大数据平台上的应用,书中都有详细介绍。
本书主要在第1版的基础上增加了两个部分:第一个是关于时间序列模型的新章节(第 9 章),这是一个源于统计学的传统主题。第二个新增的章节是深度学习(第 11 章),它是机器学习的一个迅速崛起的子领域。除了增加这两个章节之外,本书中的文本和代码会以一种读者友好的新格式来整体呈现。新版会继续专注于使用流行的统计编程语言 R 来构建用例。对于深度学习这样的主题,我们建议采用 Python 语言来配合 TensorFlow 这样的框架。但是,在第2版中,我们会向读者展示如何在 TensorFlow 中使用 R 语言编程,因此如果读者只熟悉 R,可以暂时无须学习 Python。与第1版一样,我们通过各种实际用例保持了机器学习理论与应用的良好平衡,为读者提供了一个真正全面的机器学习主题集合。
译者序
前言
第1章 机器学习和R语言入门
1.1 了解发展历程
1.1.1 统计学习
1.1.2 机器学习
1.1.3 人工智能
1.1.4 数据挖掘
1.1.5 数据科学
1.2 概率与统计
1.2.1 计数和概率的定义
1.2.2 事件和关系
1.2.3 随机性、概率和分布
1.2.4 置信区间和假设检验
1.3 R语言入门
1.3.1 基本组成部分
1.3.2 R语言的数据结构
1.3.3 子集处理
1.3.4 数和Apply系列
1.4 机器学习过程工作流
1.4.1 计划
1.4.2 探索
1.4.3 构建
1.4.4 评估
1.5 其他技术
1.6 小结
第2章 数据准备和探索
2.1 规划数据收集
2.1.1 变量类型
2.1.2 数据格式
2.1.3 数据源的类型
2.2 初始数据分析
2.2.1 初步印象
2.2.2 把多个数据源组织到一起
2.2.3 整理数据
2.2.4 补充更多信息
2.2.5 重塑
2.3 探索性数据分析
2.3.1 摘要统计量
2.3.2 矩
2.4 案例研究:信用卡欺诈
2.4.1 数据导入
2.4.2 数据变换
2.4.3 数据探索
2.5 小结
第3章 抽样与重抽样技术
3.1 介绍抽样技术
3.2 抽样的术语
3.2.1 样本
3.2.2 抽样分布
3.2.3 总群体的均值和方差
3.2.4 样本均值和方差
3.2.5 汇总的均值和方差
3.2.6 抽样点
3.2.7 抽样误差
3.2.8 抽样率
3.2.9 抽样偏误
……
第4章 R语言里的数据可视化
第5章 特征工程
第6章 机器学习理论和实践
第7章 机器学习模型的评估
第8章 模型性能改进
第9章 时间序列模型
第10章 可扩展机器学习和相关技术
第11章 用Keras和Tensorflow进行深度学习
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录