第1部分 入门
第1章 人在回路机器学习导论
1.1 人在回路机器学习的基本原理
1.2 标注简介
1.2.1 简单及较为复杂的标注策略
1.2.2 填补数据科学知识空白
1.2.3 高质量的人工标注:标注为何如此困难?
1.3 主动学习简介:提升速度和降低训练数据成本
1.3.1 三种常见的主动学习采样策略:不确定性采样、多样性采样、随机采样
1.3.2 什么是随机选择的评估数据?
1.3.3 什么时候运用主动学习
1.4 机器学习与人机交互
1.4.1 用户界面:如何创建训练数据?
1.4.2 启动效应:什么会影响人类的感知?
1.4.3 通过评估机器学习预测进行标注的优缺点
1.4.4 设计标注界面的基本原则
1.5 机器学习辅助人类与人类辅助机器学习
1.6 利用迁移学习快速启动模型
1.6.1 计算机视觉中的迁移学习
1.6.2 自然语言处理中的迁移学习
1.7 本书中能学到什么
1.8 小结
第2章 人在回路机器学习入门
2.1 超越黑客式学习:第一个主动学习算法
2.2 第一个系统的架构
2.3 解释模型预测和数据以支持主动学习
2.3.1 置信度排序
2.3.2 标识离群值
2.3.3 迭代后的预期结果
2.4 构建人工标注界面
2.4.1 一个简单的文本标注界面
2.4.2 管理机器学习数据
2.5 部署你的第一个人在回路机器学习系统
2.5.1 获得评估数据总是优先事项
2.5.2 每个数据点都有机会
2.5.3 为数据选择正确的策略
2.5.4 重新训练模型并迭代
2.6 小结
第2部分 主动学习
第3章 不确定性采样
3.1 解释机器学习模型中的不确定性
3.1.1 为什么要在模型中寻找不确定性?
3.1.2 softmax函数和概率分布
3.1.3 解释主动学习的成效
3.2 不确定性采样算法
3.2.1 最低置信度采样
3.2.2 置信度边际采样
3.2.3 置信度比率采样
3.2.4 基于熵(分类熵)的采样
3.2.5 对熵的深入探讨
3.3 识别不同类型的模型何时出现混淆
3.3.1 使用logistic回归和MaxEnt模型进行不确定性采样
3.3.2 使用SVM进行不确定性采样
3.3.3 使用贝叶斯模型进行不确定性采样
3.3.4 使用决策树和随机森林进行不确定性采样
3.4 衡量多个预测结果的不确定性
3.4.1 使用集成模型进行不确定性采样
……
第3部分 标注
第4部分 针对机器学习的人机交互
展开