第1章 用k最近邻算法解决分类问题
1.1 Mary对温度的感觉
1.2 实现k最近邻算法
1.3 意大利地区的示例——选择k值
1.4 房屋所有权——数据转换
1.5 文本分类——使用非欧几里德距离
1.6 文本分类——更高维度的k-NN
1.7 小结
1.8 习题
第2章 朴素贝叶斯
2.1 医疗检查——贝叶斯定理的基本应用
2.2 贝叶斯定理的证明及其扩展
2.3 西洋棋游戏——独立事件
2.4 朴素贝叶斯分类器的实现
2.5 西洋棋游戏——相关事件
2.6 性别分类——基于连续随机变量的贝叶斯定理
2.7 小结
2.8 习题
第3章 决策树
3.1 游泳偏好——用决策树表示数据
3.2 信息论
3.3 ID3算法——构造决策树
3.4 用决策树进行分类
3.5 小结
3.6 习题
第4章 随机森林
4.1 随机森林算法概述
4.2 游泳偏好——随机森林分析法
4.3 随机森林算法的实现
4.4 下棋实例
4.5 购物分析——克服随机数据的不一致性以及度量置信水平
4.6 小结
4.7 习题
第5章 k-means聚类
5.1 家庭收入——聚类为k个簇
5.2 性别分类——聚类分类
5.3 k-means聚类算法的实现
5.4 房产所有权示例——选择簇的数量
5.5 小结
5.6 习题
第6章 回归分析
6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归
6.2 根据身高预测体重——基于实际数据的线性回归
6.3 梯度下降算法及实现
6.4 根据距离预测飞行时长
6.5 弹道飞行分析——非线性模型
6.6 小结
6.7 习题
第7章 时间序列分析
7.1 商业利润——趋势分析
7.2 电子商店的销售额——季节性分析
7.3 小结
7.4 习题
附录A 统计
A.1 基本概念
A.2 贝叶斯推理
A.3 分布
A.4 交叉验证
A.5 A/B测试
附录B R参考
B.1 介绍
B.2 数据类型
B.3 线性回归
附录C Python参考
C.1 介绍
C.2 数据类型
C.3 控制流
附录D 数据科学中的算法和方法术语
展开