泸西县图书馆“U书快借”平台

精彩书摘

第1章绪论
　　数字图像处理与分析是信息科学领域的一个重要分支，已广泛应用于工业、农业、林业、军事、航空航天和医学等领域。近年来，视觉图像处理与分析发展迅速，尤其在农业领域中的大田作物农情监测、畜禽生理生长信息感知分析、果蔬病虫害识别诊断、农产品无损检测、农业自然资源调查与评价、智能农机装备导航、林业和水利资源监测等方面显示出巨大的应用潜力。
　　本书围绕现代农业发展和应用中常见的数字图像处理与分析基本理论和方法，主要讲授两方面内容：一是图像增强，用于改善图像视觉质量，有利于后续处理；二是图像分割、特征提取及图像压缩，用于图像理解和提高存储效率。掌握数字图像处理与分析的基本理论、方法和技能是后续深入学习图像理解、视频分析、模式识别和立体视觉等内容的基础。本章主要讲述数字图像处理与分析的基本概念、主要内容、基本步骤、系统组成及其在农业领域中的应用。
　　1.1 什么是数字图像处理与分析
　　1.1.1 数字图像
　　人类获取的信息中80%以上来自视觉，应用计算机处理与分析图像已经渗透到现代社会生活的方方面面，如人脸识别、指纹检测、移动设备扫码、产品缺陷检测、自动驾驶和文字识别等。*早的图像处理技术起源于20 世纪20 年代的报业，经过数字压缩后的图像*次通过海底电缆从伦敦传到纽约，该技术将当时一幅图像的传输时间由一星期缩短至3h。1969年，美国贝尔实验室的威拉德博伊尔和乔治史密斯发明的CCD 成像传感器把光信号变成电信号，为视觉信息的数字化提供了技术依据。CCD 的出现改变了人类用胶片记录影像的历史
　　其发明者在2009 年获得诺贝尔物理学奖。当今，数字图像不仅是科学分析的重要工具，也深入到人们的日常生活。
　　人眼所见的图像可以看成一个二维函数f (x， y)，其自变量x 和y 为图像中像素的空间位置，对应的函数值代表该图像在(x， y)处的颜色值。根据空域和值域是否为离散值，图像可分成模拟图像和数字图像。早期胶片相机拍摄的图像就是一种典型的模拟图像，其像素位置和颜色值是连续变化的。而数字图像的空域和值域均为有限离散值，这种离散化特性使得计算机等数字设备能够取出图像中的任何像素进行处理和分析。随着数字成像设备***和计算机处理能力的不断提升，数字图像已成为图像处理与分析的主要数据形式。
　　图1-1 是一幅草莓图像及其局部区域的颜色值。可以看出，数字图像是由离散的像素构成的，每个像素的颜色值都是一个三维向量，由红、绿、蓝(R、G、B)三个通道构成。
　　图1-1 草莓图像及其局部区域的颜色值
　　1.1.2 主要目的和任务
　　图像作为人类感知客观世界的重要来源，其处理与分析有助于提高图像视觉质量、提取和挖掘图像中包含的有用信息，以便于图像的存储和传输，在工业、农业、军事、医学和测绘等领域的工程实践和科学研究中都有重要的意义。
　　图像处理与分析任务通常分为以下几个方面。
　　(1)对图像去除噪声或进行滤波。例如，在阴雾或雨雪等天气条件下拍摄的图像颜色普遍偏暗，或者因为成像设备原因而导致图像中存在噪声，这些情况都需要利用去噪或滤波处理来提高图像视觉质量。这类处理输出的图像不改变原始图像的主要内容，如图1-2 所示，一幅存在椒盐噪声的偏暗昆虫图像经过中值滤波和灰度拉伸后，图像的视觉质量显著提高。
　　图1-2 存在椒盐噪声的偏暗昆虫图像及其增强结果
　　(2)对图像进行分割或提取特定信息。例如，分割出图像中的感兴趣区域，提取图像中的直线、圆等特定特征信息。这类处理输出的仍是图像，但可能是原始图像内容的一个抽象表示。图1-3 是通过语义分割方法提取冬小麦农田图像中的倒伏区域。
　　图1-3 冬小麦农田倒伏区域提取结果
　　(3)对图像进行有损或无损压缩。例如，当前海量的农业视频图像具有分辨率高和监测周期长等特点，需要占用巨大的存储资源，而经过压缩后，可以大大提高传输或存储效率，降低处理成本。
　　(4)理解图像内容。其主要是基于从图像中提取的特征，采用机器学习或模式识别等方法，对目标赋予标记。例如，在提取不同农作物的颜色或纹理特征后，利用人工神经网络或支持向量机等方法对其进行分类和识别。图1-4 中在提取奶山羊图像特征后，通过模式识别方法理解图像，可以准确识别其站立、吃草和躺卧等常见行为。
　　图1-4 基于图像分析的奶山羊行为识别
　　1.1.3 与计算机视觉和模式识别的关系
　　在阅读相关文献时，经常会遇到数字图像处理与分析、计算机视觉、模式识别三个密切相关而又有区别的学科。
　　数字图像处理与分析是利用计算机对图像进行分析，其处理结果通常仍为图像或者从图像中提取的感兴趣对象的特征，这个领域中有代表性的国际期刊是IEEE Transactions on Image Processing。
　　计算机视觉是用计算机模拟人的视觉机理，着重从图像中提取信息，并进行分析、识别和理解的过程，广义的计算机视觉也包含图像处理与分析的主要内容，这个领域中有代表性的国际期刊是International Journal of Computer Vision，国际会议是ICCV(International Conference on Computer Vision)和ECCV(European Conference on Computer Vision)。
　　模式识别是指对表征事物或现象的各种形式的数据信息(图像、文字、逻辑关系等)进行处理和分析，以实现对事物或现象进行描述、辨认、分类和解释的过程，是信息科学和人工智能的重要组成部分。视觉任务在模式识别方面*具代表性的国际期刊和会议分别是IEEE Transactions on Pattern Analysis and Machine Intelligence 和CVPR(Conference on Computer Vision and Pattern Recognition)。
　　随着学科交融的深入，这些领域研究的界限并不明显。许多计算机视觉任务和模式识别任务都依赖人工智能和机器学习领域的相关科研成果，这进一步促进了数字图像处理与分析学科的发展。
　　数字图像处理与分析的主要内容包括数字图像基础、数学基础、图像增强、图像形态学、数字图像处理与分析图像分割、图像特征提取与描述、图像压缩、机器学习基础等。
　　1．数字图像基础
　　数字图像基础的内容主要包括数字图像的基础知识及实验平台。*先引入视觉图像应用的基础—视觉感知和颜色空间；其次介绍图像数字化的主要参数、农业图像的常见类型、图像文件格式及像素间的基本关系；*后介绍本书**的图像处理与分析实验平台，具体内容见第2章。
　　2．数学基础
　　从信息处理和分析的角度看，数字图像实际上是一个二维或三维数组，图像处理与分析方法通常会涉及一些基础和共性的数学知识。例如，图像锐化、边界检测和纹理描述等都会用到梯度的概念；期望和方差等统计理论与图像分割和矩不变量等有着密切的联系；而基于变换域的傅里叶变换则可用于图像去噪和描述目标的形状。因此，为了更好地掌握图像处理与分析的主要内容，建议先学习相关的数学基础，这将对学好本门课程的专业知识非常有益，具体见第3章。
　　3．图像增强
　　图像增强包括空域增强、频域增强和图像复原，增强的目的是提高图像视觉质量或满足后续处理与分析的要求。其中，空域增强和频域增强并不考虑图像质量下降的原因，仅对图像在原始的空域或将其变换到频域进行增强，具体内容见第4章和第5章。而图像复原是指针对污染或畸变的模糊图像，根据图像质量降低的原因建立相应增强模型，从而恢复图像的本来面目，其内容在农业图像处理中的应用相对较少，故本书中不做介绍。
　　4．图像形态学
　　形态学是基本集合论中用于表示和描述形状成分的处理工具，主要内容包括二值图像与灰值图像的膨胀、腐蚀、开运算和闭运算，以及提取目标的轮廓和骨架，常用在目标识别和图像分割的后处理中。例如，当图像分割的结果存在噪点或孔洞时，形态学处理可以在不损失主要信息的情况下将其滤掉，这部分内容将在第6章中介绍。
　　5．图像分割
　　图像分割是指将一幅图像划分为多个组成部分或目标，输出仍为图像，且属于同一个目标的像素被赋予相同的标记。现代图像分割通常研究语义分割和实例分割两类问题。前者对图像中的每个像素都划分出对应的类别，实现像素级别的分类，并不限制分割结果的形状。而后者通常先检测一个包围目标的矩形框，并识别其类别，接着在矩形框内部，利用一定的方法分离出前景和背景。例如，图1-5(a)中某种作物的种植区域识别出来，得到图1-5(b)，属于语义分割；而图1-5(c)为植物工厂中的圣女果图像，在自动采摘时，对果实和果梗进行实例分割，得到图1-5(d)。图像分割将在第7章中介绍。
　　图1-5 语义分割和实例分割举例
　　6．图像特征提取与描述
　　图像特征通常包括颜色特征、形状特征及纹理特征等，从图像中提取各种各样的特征并进行描述是图像分析中的一个重要环节，直接影响后续图像理解的正确性。例如，叶片形状特征是叶片识别的重要依据，而纹理特征是进行作物图像分类和表型鉴定的重要依据。例如，图1-6(a)是4 个品种的葡萄叶片，可以利用其外形区别，提取它们的几何形状特征作为叶片识别的依据；在图1-6(b)的无人机遥感图像中含有葵花的4 个生育期，显然，不同生育期在纹理分布上具有不同特征，可以将其作为作物表型鉴定的依据。这部分内容将在第8章介绍。
　　图1-6 农业图像特征提取与描述举例
　　7．图像压缩
　　图像压缩是指在尽可能不影响图像质量的前提下，用更少的空间存储图像数据，图像压缩通常通过图像编码实现。图像编码主要是利用图像信号的统计特性及人类视觉的生理学及心理学特性，对图像信号进行编码，压缩数据，有利于图像存储和传输。数字图像的特点之一是数据量庞大，这一点在智慧农业应用中特别突出。尽管现在存储设备的容量越来越大，但是对图像数据(尤其是视频图像、高分辨率图像)的需求量也大大增加。因此，高效压缩图像是图像处理中的一个重要任务。
　　图1-7 是一幅花朵图像按60%的品质保留压缩前后的结果对比，压缩前图像占124KB，压缩后占8KB，压缩比高达15.5∶1。可以看出，在光滑区域，信息损失较小，在边界和细节处，有一定的损失。因此，图像压缩以非常少的存储空间保留了图像的主要信息，具体内容将在第9章介绍。
　　图1-7 花朵图像压缩前后的结果比较
　　8．机器学习基础
　　机器学习是计算机科学与人工智能的重要分支，目前主流的方式是深度学习。而图像处理是机器学习应用*广泛的领域之一，现代农业中多种多样的图像处理需求为机器学习提供了丰富的应用场景。第10章主要介绍了“有监督机器学习”的内容，包括**的机器学习方法(如线性预测器、逻辑回归)和BP 神经网络的基本理论。此外，还简要介绍了深度学习中的卷积神经网络和Transformer 模型及其在农业领域中的应用。
　　1.3 数字图像处理与分析系统组成
　　图像处理与分析系统可分为硬件系统和软件系统。硬件系统主要包括用于获取数字图像的传感器、计算机、存储设备和显示设备。软件系统由执行特定任务的各个专用模块构成，软件包为用户提供编写这些专用模块的代码所需的函数或类库。图1-8 是一个通用的图像处理与分析系统。
　　1．图像采集系统
　　图像采集系统包括图像采集卡和图像处理卡。图像采集卡能够对视觉场景进行采样、量化后将其转换化为数字图像，并进行存储。

展开

目录
第1章绪论1
1.1 什么是数字图像处理与分析1
1.1.1 数字图像1
1.1.2 主要目的和任务2
1.1.3 与计算机视觉和模式识别的关系3
1.2 主要内容3
1.3 数字图像处理与分析系统组成6
1.4 农业领域典型应用及特点7
1.4.1 作物生长特征检测与识别8
1.4.2 畜禽生理生长信息感知与分析9
1.4.3 果蔬病虫害识别诊断9
1.4.4 农产品无损检测10
1.4.5 农业自然资源调查与评价10
1.4.6 智能农机精准作业11
1.4.7 森林资源监测与管理11
1.4.8 水利资源环境调查与监控12
习题12
第2章数字图像基础13
2.1 人眼成像与视觉感知13
2.1.1 光与电磁波13
2.1.2 人眼结构14
2.1.3 人眼的成像过程14
2.2 彩色基础与颜色模型15
2.2.1 视觉三原色原理15
2.2.2 CIE RGB/XYZ 三色空间15
2.2.3 颜色的属性16
2.2.4 CIE 色度图17
2.2.5 颜色模型18
2.3 图像的数字化与图像类型21
2.3.1 采样和量化21
2.3.2 图像的数字化表示22
2.3.3 农业数字图像类型23
2.3.4 图像文件格式26
数字图像处理与分析
2.4 像素间的基本关系27
2.4.1 像素的邻域像素27
2.4.2 邻接、连通、区域27
2.4.3 像素的距离度量28
2.5 数字图像处理与分析实验平台29
2.5.1 Python 图像处理与分析库29
2.5.2 OpenCV 发展历史29
2.5.3 Python-OpenCV 实验平台30
2.5.4 NumPy 包简介30
2.5.5 Python-OpenCV 图像处理应用举例32
习题35
第3章数学基础37
3.1 图像的向量和矩阵运算37
3.1.1 向量37
3.1.2 内积和外积38
3.1.3 矩阵运算38
3.2 空域运算中的数学方法39
3.2.1 线性变换与非线性变换39
3.2.2 点处理40
3.2.3 区处理40
3.3 图像的几何变换41
3.3.1 齐次坐标41
3.3.2 仿射变换41
3.3.3 组合变换43
3.3.4 图像配准43
3.4 图像的梯度及差分近似44
3.4.1 梯度44
3.4.2 泰勒级数45
3.4.3 一阶差分近似一阶导数45
3.4.4 二阶差分近似二阶导数47
3.4.5 拉普拉斯算子47
3.4.6 边界的微分性质48
3.5 图像的变换域处理49
3.5.1 复数基本概念49
3.5.2 三角级数及其正交性50
3.5.3 傅里叶级数的三角函数形式51
3.5.4 傅里叶级数的复数形式52
3.5.5 傅里叶变换53
3.5.6 一维信号变换53
3.5.7 二维图像变换54
3.5.8 可分离对称变换核55
3.6 图像的统计性质56
3.6.1 灰度值为随机变量的概率密度函数56
3.6.2 空间坐标为随机变量的图像矩57
习题58
第4章图像的空域处理60
4.1 灰度变换60
4.1.1 灰度反转60
4.1.2 对比度拉伸/压缩60
4.1.3 非线性变换61
4.2 直方图增强63
4.2.1 灰度直方图63
4.2.2 直方图均衡化64
4.2.3 直方图规定化67
4.3 图像几何插值69
4.3.1 基本概念69
4.3.2 *近邻插值70
4.3.3 双线性插值70
4.3.4 超分辨率重建71
4.4 图像平滑71
4.4.1 图像噪声72
4.4.2 模板卷积72
4.4.3 可分离卷积74
4.4.4 邻域平滑74
4.4.5 中值滤波75
4.5 自适应滤波77
4.5.1 双边滤波77
4.5.2 导向滤波78
4.6 图像锐化79
4.6.1 钝化掩模和高提升滤波80
4.6.2 拉普拉斯图像锐化法81
4.7 伪彩色增强82
4.7.1 灰度分层82
4.7.2 灰度到彩色的变换83
4.7.3 频域伪彩色增强84
习题84
第5章图像的频域处理87
5.1 一维傅里叶变换87
5.1.1 连续函数的傅里叶变换88
5.1.2 离散傅里叶变换89
5.1.3 一维离散傅里叶变换的性质91
5.2 二维傅里叶变换93
5.2.1 连续二维函数的傅里叶变换93
5.2.2 二维离散函数的傅里叶变换93
5.2.3 二维离散傅里叶变换性质93
5.3 傅里叶变换在图像处理中的应用96
5.3.1 频域图像处理步骤97
5.3.2 频域滤波97
5.4 离散余弦变换101
5.4.1 一维离散余弦变换101
5.4.2 二维离散余弦变换101
5.5 小波变换103
5.5.1 小波变换理论基础103
5.5.2 二维小波变换105
5.5.3 小波变换在图像处理中的应用107
习题108
第6章图像形态学109
6.1 数学形态学109
6.1.1 集合运算109
6.1.2 逻辑运算111
6.1.3 结构元素与几何变换111
6.2 二值形态学112
6.2.1 腐蚀113
6.2.2 膨胀114
6.2.3 开/闭运算115
6.2.4 对偶性117
6.2.5 击中/击不中变换118
6.3 灰值形态学119
6.3.1 灰值腐蚀120
6.3.2 灰值膨胀120
6.3.3 灰值开/闭运算121
6.4 形态学算法及应用123
6.4.1 形态学滤波123
6.4.2 边界提取124
6.4.3 图像分割124
6.4.4 骨架提取126
6.4.5 端点检测127
6.4.6 阴影校正128
习题129
第7章图像分割131
7.1 基本概念131
7.2 边界检测132
7.2.1 梯度与边界方向132
7.2.2 一阶梯度边界检测133
7.2.3 方向梯度法135
7.2.4 二阶导数边界检测136
7.2.5 Canny 边界检测算子138
7.2.6 边界连接139
7.2.7 霍夫变换直线检测139
7.3 阈值分割142
7.3.1 迭代阈值法142
7.3.2 Otsu 阈值法143
7.3.3 基于边界的改进阈值分割144
7.3.4 动态阈值法144
7.4 基于区域的分割145
7.4.1 区域生长145
7.4.2 区域分裂与区域合并146
7.5 分水岭分割147
7.5.1 基本术语147
7.5.2 淹没法148
7.5.3 应用举例——连接籽粒分割148
7.6 Mean Shift 分割149
7.6.1 Mean Shift 理论149
7.6.2 Mean Shift 图像滤波和分割151
7.7 SLIC 超像素分割152
7.7.1 k 均值聚类图像分割152
7.7.2 SLIC 超像素分割153
7.8 主动轮廓模型155
7.8.1 能量函数155
7.8.2 局限156
7.9 图割157
7.9.1 硬约束和软约束157
7.9.2 能量函数158
习题160
第8章图像特征提取与描述162
8.1 颜色特征162
8.1.1 颜色直方图162
8.1.2 颜色矩164
8.1.3 颜色聚合向量165
8.1.4 植被颜色指数167
8.2 形状特征169
8.2.1 边界特征169
8.2.2 区域特征175
8.2.3 角点特征179
8.3 纹理特征181
8.3.1 灰度直方图统计矩181
8.3.2 灰度共生矩阵183
8.3.3 Tamura 纹理185
8.3.4 局部二值模式186
8.3.5 傅里叶谱188
8.4 现代特征描述子190
8.4.1 尺度不变特征变换190
8.4.2 加速稳健特征193
8.4.3 方向梯度直方图特征195
习题197
第9章图像压缩200
9.1 概述200
9.1.1 图像数据冗余200
9.1.2 编码冗余基础201
9.1.3 图像压缩基本过程202
9.1.4 图像压缩质量评价202
9.2 基本编码定理203
9.2.1 信息量203
9.2.2 熵204
9.2.3 无损编码术语204
9.3 无损压缩编码205
9.3.1 香农-范诺编码205
9.3.2 霍夫曼编码207
9.3.3 算术编码207
9.3.4 LZW 编码209
9.4 JPEG 图像压缩标准简介211
9.4.1 JPEG 212
9.4.2 JPEG 2000213
9.4.3 JPEG 2000 编码实例213
9.5 视频编码214
9.5.1 帧间编码214
9.5.2 运动补偿编码215
9.5.3 MPEG 215
习题216
第10章机器学习基础218
10.1 有监督机器学习218
10.1.1 线性预测器218
10.1.2 损失函数及其*小化219
10.1.3 梯度下降算法220
10.1.4 逻辑回归221
10.1.5 图像的多分类问题222
10.1.6 模型性能评估222
10.1.7 模型选择224
10.2 BP 神经网络224
10.2.1 特征与预测器的联合学习225
10.2.2 BP 神经网络架构226
10.2.3 反向传播算法227
10.2.4 BP 神经网络的梯度下降算法229
10.3 卷积神经网络229
10.3.1 从全连接到卷积229
10.3.2 卷积与池化230
10.3.3 典型卷积神经网络架构231
10.3.4 卷积神经网络的反向传播算法232
10.4 卷积神经网络应用233
10.4.1 图像目标检测233
10.4.2 实例分割235
10.4.3 语义图像分割236
10.4.4 视觉目标跟踪238
10.4.5 视频行为识别238
10.5 Transformer 及其应用239
10.5.1 Transformer 简介239
10.5.2 Transformer 在视觉领域的应用241
习题242
参考文献244
附录名词术语246

展开