第 1章 深度学习与计算机视觉基础 001
1.1 人工智能简介 002
1.2 深度学习的崛起以及存在的问题 003
1.3 神经网络的基本概念 004
1.3.1 前馈神经网络 005
1.3.2 反向传播算法 005
1.3.3 权重系数更新 007
1.4 卷积神经网络原理 007
1.4.1 CNN的起源与发展 008
1.4.2 CNN结构简介 009
1.4.3 CNN的其他组件 016
1.5 计算机视觉简介 019
参考文献 020
第 2章 基于深度学习的图像分类算法 023
2.1 图像分类——从特征设计到卷积神经网络结构设计 024
2.2 卷积神经网络结构演化 026
2.2.1 从LeNet到VGG 026
2.2.2 Inception系列 028
2.2.3 ResNet系列 029
2.2.4 DenseNet系列 031
2.2.5 SqueezeNet系列 033
2.2.6 ShuffleNet系列 034
2.2.7 MobileNet系列 035
2.3 神经架构搜索 037
2.4 CNN的计算量与参数计算方法 037
2.5 小结 038
参考文献 039
第3章 基于深度学习的目标检测算法 043
3.1 目标检测——从特征设计到深度学习 044
3.1.1 任务简介 044
3.1.2 传统的目标检测算法 045
3.1.3 基于深度学习的目标检测方法 046
3.2 目标检测的重要概念 047
3.2.1 交并比和非极大值抑制 047
3.2.2 难负样本挖掘 048
3.2.3 边框回归 049
3.2.4 检测任务中的数据增广 050
3.2.5 先验框/默认边框/锚框 050
3.2.6 锚框与真实边框的匹配策略 051
3.2.7 感受野 051
3.2.8 RoI特征图映射 052
3.3 双阶段检测算法 054
3.3.1 从R-CNN到Fast R-CNN 054
3.3.2 Faster R-CNN算法原理 057
3.4 单阶段检测算法 061
3.4.1 YOLO检测算法 061
3.4.2 SSD检测算法 067
3.5 融合单阶段和双阶段的算法 073
3.5.1 单阶段检测算法及双阶段检测算法的特点 073
3.5.2 RefineDet:结合单阶段及双阶段优点 074
3.6 从头训练的检测算法 075
3.6.1 从头训练的检测算法简介 075
3.6.2 精心设计CNN实现从头训练 076
3.6.3 从头训练的本质 077
3.7 检测任务中的级联设计 079
3.7.1 传统的级联检测算法 079
3.7.2 深度学习下的级联检测 079
3.8 多尺度目标检测 081
3.8.1 问题描述以及常用方法 081
3.8.2 多尺度训练/测试 082
3.8.3 特征金字塔融合多层特征 082
3.8.4 小尺寸目标检测 086
3.9 检测任务中的不平衡处理策略 087
3.9.1 双阶段中的不平衡策略 087
3.9.2 单阶段中的不平衡策略 088
3.10 锚框的轮回 089
3.10.1 锚框的起源 089
3.10.2 现有检测算法中锚框的设计方法 090
3.10.3 锚框存在的问题 091
3.10.4 不需要锚框的算法 092
3.11 目标检测的骨干网络设计 092
3.12 检测算法加速 093
3.12.1 检测流程的加速 094
3.12.2 检测算法的轻量级网络 094
3.13 自然场景文字检测 095
3.14 遥感图像目标检测 096
3.15 常用数据集和评价指标 098
参考文献 099
第4章 基于深度学习的图像语义分割算法 103
4.1 图像语义分割简介 104
4.2 语义分割研究难点 105
4.3 语义分割算法模型 106
4.3.1 全卷积网络基础算法:FCN算法 106
4.3.2 编码 解码结构算法:U-Net算法 109
4.3.3 空洞卷积的应用:DeepLab系列 111
4.4 图像实时语义分割 117
4.4.1 实时语义分割简介 117
4.4.2 ENet算法 118
4.5 图像分割数据集以及评价指标 122
4.5.1 图像分割数据集 122
4.5.2 语义分割评估指标 123
参考文献 124
第5章 基于深度学习的人体姿态估计算法 127
5.1 人体姿态估计任务简介 128
5.1.1 任务简介 128
5.1.2 面临的挑战 130
5.1.3 方法概述 130
5.2 单人姿态估计 132
5.3 自顶向下的多人姿态估计 133
5.4 自底向上的多人姿态估计 134
5.5 常用数据集以及评价指标 136
参考文献 136
第6章 基于深度学习的行人重识别与目标跟踪 139
6.1 行人重识别任务简介 140
6.1.1 任务简介 140
6.1.2 工作流程 141
6.1.3 面临的挑战 142
6.1.4 与行人跟踪和人脸验证的关系 143
6.1.5 行人重识别数据集及评价指标 144
6.2 特征提取和相似度度量 144
6.3 行人重识别:从全局特征到局部特征 145
6.4 行人重识别:从表征学习到度量学习 148
6.5 目标跟踪任务简介 149
6.6 基于相关滤波的目标跟踪算法 150
6.7 基于孪生网络的跟踪算法 151
参考文献 153
第7章 基于深度学习的人脸识别 155
7.1 任务简介 156
7.1.1 人脸验证和人脸识别的区别 156
7.1.2 图像分类和人脸识别的异同 157
7.1.3 技术难点 157
7.1.4 人脸识别算法原理 158
7.2 Softmax原理及存在的问题 160
7.2.1 Softmax函数和Softmax损失 160
7.2.2 Softmax存在的问题 161
7.3 度量损失 162
7.3.1 对比损失 162
7.3.2 三元组损失 163
7.4 大间隔损失 165
7.4.1 L-Softmax 165
7.4.2 SphereFace 166
7.4.3 CosFace 167
7.4.4 ArcFace 167
7.4.5 大间隔损失总结 168
7.5 特征规范化和权重规范化 171
参考文献 172
第8章 基于深度学习的图像超分辨率重建方法 175
8.1 任务简介 176
8.2 传统方法 179
8.2.1 基于插值的方法 179
8.2.2 基于重建的方法 180
8.2.3 基于学习的方法 180
8.3 基于卷积神经网络的图像超分辨率重建方法 181
8.3.1 网络模型 182
8.3.2 损失函数 184
8.3.3 训练样本 184
8.3.4 训练策略 185
8.4 常用数据集与评价指标 186
参考文献 187
展开