第1章 绪论
数字图像处理与分析是信息科学领域的一个重要分支,已广泛应用于工业、农业、林业、军事、航空航天和医学等领域。近年来,视觉图像处理与分析发展迅速,尤其在农业领域中的大田作物农情监测、畜禽生理生长信息感知分析、果蔬病虫害识别诊断、农产品无损检测、农业自然资源调查与评价、智能农机装备导航、林业和水利资源监测等方面显示出巨大的应用潜力。
本书围绕现代农业发展和应用中常见的数字图像处理与分析基本理论和方法,主要讲授两方面内容:一是图像增强,用于改善图像视觉质量,有利于后续处理;二是图像分割、特征提取及图像压缩,用于图像理解和提高存储效率。掌握数字图像处理与分析的基本理论、方法和技能是后续深入学习图像理解、视频分析、模式识别和立体视觉等内容的基础。本章主要讲述数字图像处理与分析的基本概念、主要内容、基本步骤、系统组成及其在农业领域中的应用。
1.1 什么是数字图像处理与分析
1.1.1 数字图像
人类获取的信息中80%以上来自视觉,应用计算机处理与分析图像已经渗透到现代社会生活的方方面面,如人脸识别、指纹检测、移动设备扫码、产品缺陷检测、自动驾驶和文字识别等。*早的图像处理技术起源于20 世纪20 年代的报业,经过数字压缩后的图像*次通过海底电缆从伦敦传到纽约,该技术将当时一幅图像的传输时间由一星期缩短至3h。1969年,美国贝尔实验室的威拉德 博伊尔和乔治 史密斯发明的CCD 成像传感器把光信号变成电信号,为视觉信息的数字化提供了技术依据。CCD 的出现改变了人类用胶片记录影像的历史
其发明者在2009 年获得诺贝尔物理学奖。当今,数字图像不仅是科学分析的重要工具,也深入到人们的日常生活。
人眼所见的图像可以看成一个二维函数f (x, y),其自变量x 和y 为图像中像素的空间位置,对应的函数值代表该图像在(x, y)处的颜色值。根据空域和值域是否为离散值,图像可分成模拟图像和数字图像。早期胶片相机拍摄的图像就是一种典型的模拟图像,其像素位置和颜色值是连续变化的。而数字图像的空域和值域均为有限离散值,这种离散化特性使得计算机等数字设备能够取出图像中的任何像素进行处理和分析。随着数字成像设备***和计算机处理能力的不断提升,数字图像已成为图像处理与分析的主要数据形式。
图1-1 是一幅草莓图像及其局部区域的颜色值。可以看出,数字图像是由离散的像素构成的,每个像素的颜色值都是一个三维向量,由红、绿、蓝(R、G、B)三个通道构成。
图1-1 草莓图像及其局部区域的颜色值
1.1.2 主要目的和任务
图像作为人类感知客观世界的重要来源,其处理与分析有助于提高图像视觉质量、提取和挖掘图像中包含的有用信息,以便于图像的存储和传输,在工业、农业、军事、医学和测绘等领域的工程实践和科学研究中都有重要的意义。
图像处理与分析任务通常分为以下几个方面。
(1)对图像去除噪声或进行滤波。例如,在阴雾或雨雪等天气条件下拍摄的图像颜色普遍偏暗,或者因为成像设备原因而导致图像中存在噪声,这些情况都需要利用去噪或滤波处理来提高图像视觉质量。这类处理输出的图像不改变原始图像的主要内容,如图1-2 所示,一幅存在椒盐噪声的偏暗昆虫图像经过中值滤波和灰度拉伸后,图像的视觉质量显著提高。
图1-2 存在椒盐噪声的偏暗昆虫图像及其增强结果
(2)对图像进行分割或提取特定信息。例如,分割出图像中的感兴趣区域,提取图像中的直线、圆等特定特征信息。这类处理输出的仍是图像,但可能是原始图像内容的一个抽象表示。图1-3 是通过语义分割方法提取冬小麦农田图像中的倒伏区域。
图1-3 冬小麦农田倒伏区域提取结果
(3)对图像进行有损或无损压缩。例如,当前海量的农业视频图像具有分辨率高和监测周期长等特点,需要占用巨大的存储资源,而经过压缩后,可以大大提高传输或存储效率,降低处理成本。
(4)理解图像内容。其主要是基于从图像中提取的特征,采用机器学习或模式识别等方法,对目标赋予标记。例如,在提取不同农作物的颜色或纹理特征后,利用人工神经网络或支持向量机等方法对其进行分类和识别。图1-4 中在提取奶山羊图像特征后,通过模式识别方法理解图像,可以准确识别其站立、吃草和躺卧等常见行为。
图1-4 基于图像分析的奶山羊行为识别
1.1.3 与计算机视觉和模式识别的关系
在阅读相关文献时,经常会遇到数字图像处理与分析、计算机视觉、模式识别三个密切相关而又有区别的学科。
数字图像处理与分析是利用计算机对图像进行分析,其处理结果通常仍为图像或者从图像中提取的感兴趣对象的特征,这个领域中有代表性的国际期刊是IEEE Transactions on Image Processing。
计算机视觉是用计算机模拟人的视觉机理,着重从图像中提取信息,并进行分析、识别和理解的过程,广义的计算机视觉也包含图像处理与分析的主要内容,这个领域中有代表性的国际期刊是International Journal of Computer Vision,国际会议是ICCV(International Conference on Computer Vision)和ECCV(European Conference on Computer Vision)。
模式识别是指对表征事物或现象的各种形式的数据信息(图像、文字、逻辑关系等)进行处理和分析,以实现对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。视觉任务在模式识别方面*具代表性的国际期刊和会议分别是IEEE Transactions on Pattern Analysis and Machine Intelligence 和CVPR(Conference on Computer Vision and Pattern Recognition)。
随着学科交融的深入,这些领域研究的界限并不明显。许多计算机视觉任务和模式识别任务都依赖人工智能和机器学习领域的相关科研成果,这进一步促进了数字图像处理与分析学科的发展。
数字图像处理与分析的主要内容包括数字图像基础、数学基础、图像增强、图像形态学、数字图像处理与分析图像分割、图像特征提取与描述、图像压缩、机器学习基础等。
1.数字图像基础
数字图像基础的内容主要包括数字图像的基础知识及实验平台。*先引入视觉图像应用的基础—视觉感知和颜色空间;其次介绍图像数字化的主要参数、农业图像的常见类型、图像文件格式及像素间的基本关系;*后介绍本书**的图像处理与分析实验平台,具体内容见第2章。
2.数学基础
从信息处理和分析的角度看,数字图像实际上是一个二维或三维数组,图像处理与分析方法通常会涉及一些基础和共性的数学知识。例如,图像锐化、边界检测和纹理描述等都会用到梯度的概念;期望和方差等统计理论与图像分割和矩不变量等有着密切的联系;而基于变换域的傅里叶变换则可用于图像去噪和描述目标的形状。因此,为了更好地掌握图像处理与分析的主要内容,建议先学习相关的数学基础,这将对学好本门课程的专业知识非常有益,具体见第3章。
3.图像增强
图像增强包括空域增强、频域增强和图像复原,增强的目的是提高图像视觉质量或满足后续处理与分析的要求。其中,空域增强和频域增强并不考虑图像质量下降的原因,仅对图像在原始的空域或将其变换到频域进行增强,具体内容见第4章和第5章。而图像复原是指针对污染或畸变的模糊图像,根据图像质量降低的原因建立相应增强模型,从而恢复图像的本来面目,其内容在农业图像处理中的应用相对较少,故本书中不做介绍。
4.图像形态学
形态学是基本集合论中用于表示和描述形状成分的处理工具,主要内容包括二值图像与灰值图像的膨胀、腐蚀、开运算和闭运算,以及提取目标的轮廓和骨架,常用在目标识别和图像分割的后处理中。例如,当图像分割的结果存在噪点或孔洞时,形态学处理可以在不损失主要信息的情况下将其滤掉,这部分内容将在第6章中介绍。
5.图像分割
图像分割是指将一幅图像划分为多个组成部分或目标,输出仍为图像,且属于同一个目标的像素被赋予相同的标记。现代图像分割通常研究语义分割和实例分割两类问题。前者对图像中的每个像素都划分出对应的类别,实现像素级别的分类,并不限制分割结果的形状。而后者通常先检测一个包围目标的矩形框,并识别其类别,接着在矩形框内部,利用一定的方法分离出前景和背景。例如,图1-5(a)中某种作物的种植区域识别出来,得到图1-5(b),属于语义分割;而图1-5(c)为植物工厂中的圣女果图像,在自动采摘时,对果实和果梗进行实例分割,得到图1-5(d)。图像分割将在第7章中介绍。
图1-5 语义分割和实例分割举例
6.图像特征提取与描述
图像特征通常包括颜色特征、形状特征及纹理特征等,从图像中提取各种各样的特征并进行描述是图像分析中的一个重要环节,直接影响后续图像理解的正确性。例如,叶片形状特征是叶片识别的重要依据,而纹理特征是进行作物图像分类和表型鉴定的重要依据。例如,图1-6(a)是4 个品种的葡萄叶片,可以利用其外形区别,提取它们的几何形状特征作为叶片识别的依据;在图1-6(b)的无人机遥感图像中含有葵花的4 个生育期,显然,不同生育期在纹理分布上具有不同特征,可以将其作为作物表型鉴定的依据。这部分内容将在第8章介绍。
图1-6 农业图像特征提取与描述举例
7.图像压缩
图像压缩是指在尽可能不影响图像质量的前提下,用更少的空间存储图像数据,图像压缩通常通过图像编码实现。图像编码主要是利用图像信号的统计特性及人类视觉的生理学及心理学特性,对图像信号进行编码,压缩数据,有利于图像存储和传输。数字图像的特点之一是数据量庞大,这一点在智慧农业应用中特别突出。尽管现在存储设备的容量越来越大,但是对图像数据(尤其是视频图像、高分辨率图像)的需求量也大大增加。因此,高效压缩图像是图像处理中的一个重要任务。
图1-7 是一幅花朵图像按60%的品质保留压缩前后的结果对比,压缩前图像占124KB,压缩后占8KB,压缩比高达15.5∶1。可以看出,在光滑区域,信息损失较小,在边界和细节处,有一定的损失。因此,图像压缩以非常少的存储空间保留了图像的主要信息,具体内容将在第9章介绍。
图1-7 花朵图像压缩前后的结果比较
8.机器学习基础
机器学习是计算机科学与人工智能的重要分支,目前主流的方式是深度学习。而图像处理是机器学习应用*广泛的领域之一,现代农业中多种多样的图像处理需求为机器学习提供了丰富的应用场景。第10章主要介绍了“有监督机器学习”的内容,包括**的机器学习方法(如线性预测器、逻辑回归)和BP 神经网络的基本理论。此外,还简要介绍了深度学习中的卷积神经网络和Transformer 模型及其在农业领域中的应用。
1.3 数字图像处理与分析系统组成
图像处理与分析系统可分为硬件系统和软件系统。硬件系统主要包括用于获取数字图像的传感器、计算机、存储设备和显示设备。软件系统由执行特定任务的各个专用模块构成,软件包为用户提供编写这些专用模块的代码所需的函数或类库。图1-8 是一个通用的图像处理与分析系统。
1.图像采集系统
图像采集系统包括图像采集卡和图像处理卡。图像采集卡能够对视觉场景进行采样、量化后将其转换化为数字图像,并进行存储。
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录