本书详细讲解基于OpenCV的传统计算机视觉和以TensorFlow代码为主的基于深度学习的计算机视觉。
本书从基本的图像特征开始,包括颜色特征、几何特征、局部特征、梯度特征,到图像美化,再到传统目标检测、光流与跟踪等;继而进入深度学习部分,首先带来深度学习的基本原理,然后是卷积神经网络的深入剖析,进而阐述如何将卷积神经网络应用于计算机视觉的物体分类、目标检测等常见问题上,最后介绍计算机视觉z新的GAN网络。本书以非常简单的公式和原理解释学习过程中遇到的问题,通过大量精美的图片让读者直观感受计算机视觉的效果,深入理解计算机视觉的核心内容。
本书适合人工智能方向的大学本科生、研究生,以及初学者阅读。对于有一定基础和经验的读者,也能帮助他们查缺补漏,深入理解和掌握相关原理和方法,提高实际解决问题的能力。
目录
第1章机器看世界
1.1计算机眼里的图像
1.2计算机视觉的起源
1.2.1马尔计算视觉
1.2.2主动和目的视觉
1.2.3多视几何和分层三维重建
1.2.4基于学习的视觉
1.3计算机视觉的难点
1.4深度学习的起源
1.5基于深度学习的计算机视觉
1.5.1研究方向
1.5.2未来发展
第2章传统图像处理之OpenCV的妙用
2.1OpenCV安装
2.2OpenCV模块
2.3OpenCV数据存取
2.4OpenCV图像基本操作
2.4.1OpenCV图像缩放
2.4.2OpenCV图像裁剪
2.4.3OpenCV图像旋转
2.5从摄像头读取
2.6矩阵操作
第3章传统图像处理之寻找特征
3.1颜色特征
3.1.1RGB颜色空间
3.1.2HIS颜色空间
3.1.3HSV颜色空间
3.1.4颜色直方图
3.1.5OpenCV图像色调,对比度变化
3.2几何特征
3.2.1边缘特征
3.2.2角点
3.2.3斑点
3.3局部特征
3.3.1SIFT算法
3.3.2SURF算法
3.4代码实战: 图像匹配
第4章传统图像处理之图像美化
4.1添加图形与文字
4.2图像美白
4.3图像修复与去噪
4.4图像轮廓
4.5图像金字塔
4.6代码实战: 图像融合
第5章传统图像处理之相机模型
5.1相机模型
5.1.1针孔相机模型
5.1.2射影几何
5.2透镜
5.3透镜畸变
第6章传统图像处理之目标检测
6.1OpenCV中的机器学习
6.1.1机器学习简介
6.1.2OpenCV机器学习数据流
6.1.3OpenCV机器学习算法
6.2基于支持向量机的目标检测与识别
6.2.1词袋算法
6.2.2隐式支持向量机算法
6.3基于树方法的目标检测与识别
6.4代码实战: 人脸识别
6.5传统图像总结
第7章深度学习初识
7.1深度学习基础
7.2正向传播、反向传播算法
7.3非线性激活函数
7.4Dropout正则化方法
7.5GPU加速运算
第8章基于深度学习的计算机视觉之卷积神经网络
8.1卷积神经网络基本架构
8.1.1卷积层
8.1.2池化层
8.1.3全连接层
8.1.4Softmax激活函数
8.1.5交叉熵损失
8.2AlexNet结构详解
8.3卷积神经网络的优点
第9章基于深度学习的计算机视觉之TensorFlow
9.1TensorFlow的起源
9.2TensorFlow基础知识
9.2.1安装
9.2.2图计算
9.2.3TensorFlow 2.0
9.2.4张量
9.2.5tf.data
9.2.6可视化
9.2.7模型存取
9.2.8Keras接口
9.2.9神经网络搭建
9.3代码实战: 手写数字
第10章基于深度学习的计算机视觉之目标识别
10.1目标识别的概念
10.2构建数据集的方法
10.3搭建神经网络
10.4训练及效果评估
10.5解决过拟合
10.6数据增强
10.7迁移学习
第11章基于深度学习的计算机视觉之两阶段目标检测
11.1什么是目标检测
11.2目标检测的难点
11.3目标检测的基础知识
11.3.1候选框
11.3.2交并比
11.3.3非极大值抑制
11.3.4传统目标检测基本流程
11.4目标检测效果评估
11.5二阶段算法: RCNN类网络
11.5.1RCNN网络
11.5.2Fast RCNN网络
11.5.3Faster RCNN网络
11.6代码实战
第12章基于深度学习的计算机视觉之阶段目标检测
12.1YOLO网络
12.1.1YOLO起源
12.1.2YOLO原理
12.1.3YOLOv2原理
12.1.4YOLOv3原理
12.1.5YOLO应用
12.2SSD网络
12.3代码实战: 车牌识别
第13章人脸识别: 传统方法VS深度学习
13.1人脸识别技术的历史
13.2人脸识别技术的发展前景
13.3人脸识别技术主要流程
13.3.1人脸识别的主要流程
13.3.2人脸识别的主要方法
13.3.3人脸识别的技术指标
13.4深度学习方法
13.5人脸识别的挑战
第14章基于深度学习的计算机视觉: 生成模型
14.1自动编码器
14.1.1去噪自动编码器
14.1.2变分自动编码器
14.2风格迁移
14.3GAN网络
参考文献
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录