第1章
引言
土地覆盖是指地球表面的物理和生物覆盖,包括水体、植被、裸土、湿地、雪/冰和人工表面等。土地覆盖格局反映了自然和社会过程。对土地覆盖进行可靠的监测制图对于了解气候变化及其影响、管理自然资源、保护生物多样性和提高对生态系统的科学认识至关重要(Gong et al.,2013;Herold et al.,2008;Liang,2008;Running,2008)。20世纪70年代以来,遥感以其快速获取大尺度地表空间信息的能力,成为土地覆盖监测制图的重要手段(Chen et al.,2015;DeFries andT ownshend,1994;Hansen et al.,2013;Loveland et al.,2000)。早期的土地覆盖制图研究多采用单个传感器在特定时间获取的遥感数据,以光谱和空间属性为主要分类特征。由于缺乏高频率获取的时间序列遥感数据,时间特征受到的关注较少。
自20世纪80年代以来,随着多时空遥感数据的更易获取,遥感数据的维度迅速增加,不仅空间分辨率和光谱分辨率得到显著提高,在时间分辨率上,多时相乃至稠密时间序列遥感数据正以前所未有的规模和速度产生。尤其是近年来以哥白尼计划(Copernicus Programme)为代表的系列卫星星座的成功实践,使得同时具有广覆盖、高空间和高时间分辨率特点的多模态卫星数据得到广泛应用,遥感已进入大数据时代,利用遥感大数据挖掘土地覆盖的时间维信息并将其用于指导土地覆盖分类和变化检测研究越来越流行。由于遥感大数据来源多样,信息挖掘与分类技术特点也不相同,本章对书中涉及的遥感大数据及时态维信息挖掘技术进展做一简要介绍。
1.1时间序列遥感数据源的发展
利用卫星数据进行全球、大陆和区域土地覆盖制图研究早已开展(DeFries and Townshend,1994;Loveland et al.,1991;Townshend et al.,1987;Tucker et al.,1985)。
早期受数据获取限制,多采用单景或少数几期遥感影像进行土地覆盖信息提取。
自20世纪80年代以来,粗空间分辨率、高时间分辨率、广覆盖的光学卫星数据获取与处理技术的发展,使得基于时间序列遥感的土地覆盖信息提取成为可能,有力地推动了全球或大陆尺度的土地覆盖分类与制图的发展。
时间序列遥感数据的早期应用以美国国家海洋和大气管理局(NOAA)系列气象卫星上搭载的先进甚高分辨率辐射仪(AVHRR)图像为代表。NOAA气象卫星采用双星运行,同一地区每天有四次过境机会。AVHRR是一种五光谱通道的扫描辐射仪,星下点分辨率为1.1km。AVHRR的主要优势是其能够对大面积地理区域进行频繁的数据获取,从而有更多机会在地表植被的重要物候阶段获得无云数据(Justice et al.,1985,1991;Loveland et al.,1991;Reed et al.,1994;Townshend et al.,1987;Townshend and Justice,1986;Tucker et al.,1985)。但早期的AVHRR数据缺乏精确的校准,几何校正误差较大,以及云层识别的困难,导致了高水平的噪声(Goward et al.,1991)。此外,由于AVHRR不是为陆地应用而设计的,因此五个光谱通道的信息应用于植被监测或土地覆盖制图还存在一定的限制。虽然后来的其他卫星传感器提供了更高质量的数据,但与AVHRR相比,它们的数据获取记录相对较短。因此,对于长期地表变化过程分析而言,AVHRR仍然是一个宝贵的、不可替代的地表历史信息记录档案。欧盟SPOT-4VEGETATION(VGT)是另一种较常用的高重访、粗空间分辨率卫星数据,其从1998年4月开始接收数据并被应用于区域到全球尺度的植被动态监测及土地覆盖制图(Boles et al.,2004;Lhermitte et al.,2008;Verbesselt et al.,2007;Xiao et al.,2002)。相比于AVHRR扫描阵列,VGT的设计在空间分辨率保真方面更优,且具有更好的定位和辐射灵敏度(Gobron et al.,2000)。
中分辨率成像光谱仪(MODIS)是搭载在美国地球观测系统(EOS)计划中Terra(1999年发射)和Aqua(2002年发射)两颗卫星上的用于观测全球生物和物理过程的主要传感器。相较于NOAA AVHRR和SPOTVEGETATION,MODIS传感器在光谱、空间、几何和辐射属性上都有很大提高,尤其是计算归一化植被指数(normalized differential vegetation index,NDVI)所需的红光和近红外波段的带宽和光谱响应得到显著改善。MODIS具有36个光谱波段(0.25~1μm),每1~2天对地球表面观测一次。MODIS传感器前7个波段集中于陆地观测,在可见光和近红外波段具有250m和500m两种空间分辨率。时间序列MODIS数据可以生成8天、16天和月度间隔的植被指数(VI)产品,为基于时间序列遥感的土地覆盖变化监测与制图提供了坚实的基础(Hansen et al.,2002)。迄今为止,在时间序列遥感应用分析研究中,MODIS数据的使用*为广泛(Friedl et al.,2002)。然而,MODIS数据的空间分辨率较低,难以捕捉中小尺度土地覆盖变化的细节信息。
众所周知,类似Landsat的30m空间分辨率的遥感数据是获取精细土地覆盖图的*适宜选择(Chen and Chen,2018)。Landsat系列卫星是由美国国家航空航天局(NASA)和美国地质调查局(USGS)共同管理的陆地资源卫星。Landsat卫星的轨道设计为与太阳同步的近极地圆形轨道,以确保北半球中纬度地区获得中等太阳高度角(25。~30。)的上午成像,而且卫星以同一地方时、同一方向通过同一地点,保证遥感观测条件的基本一致,利于图像的对比。Landsat TM/ETM+/OLI多光谱传感器空间分辨率为30m,每16天重复覆盖一次。Landsat卫星数据的应用可以追溯到20世纪70年代,该卫星保持了迄今为止对地球表面动态*长时间的连续、一致的天基观测记录(Roy et al.,2010)。经过近50年的连续观测,Landsat丰富的存档影像提供了一个了解地表历史的窗口。但在2008年之前,Landsat数据很少被用于密集的时间序列分析研究中。其主要原因包括,低重访周期,云层、云影和其他不良大气造成的影像质量影响,系列卫星在传感器的光谱和空间特征上的一致性问题,以及数据分发限制等(Vogelmann et al.,2016)。2008年,对整个Landsat存档数据的免费访问从根本上改变了Landsat数据的使用方式(Woodcock et al.,2008;Wulder et al.,2012)。同时,技术、方法和工具方面的进展(Roy et al.,2010)使集成和分析Landsat数据时间序列变得更加容易(Hansen et al.,2011),从而使得基于Landsat时间序列分析成为可能。鉴于一年内Landsat可用卫星影像较少,难以支撑快速地表变化的年内时间序列分析,如植被物候识别,当前对Landsat的时间序列分析多是利用多年获取图像的联合分析,应用上主要集中在年际间的土地覆盖变化检测与分类(Verbesselt et al.,2012;Zhu and Woodcock,2014)。
近年来,欧洲航天局(ESA)在哥白尼计划框架下发射的光学/雷达组合的Sentinel系列卫星以前所未有的空间-时间-光谱分辨率对陆地、海洋和大气进行监测(Drusch et al.,2012),同时,免费数据分发策略催生了多领域的时间序列遥感分析应用。Sentinel-1是由搭载C波段SAR传感器的两颗卫星组成的卫星星座。Sentinel-1A于2014年4月3日发射,Sentinel-1B于2016年4月25日发射,可在任何天气条件下提供具有双重极化能力的SAR遥感影像。两颗卫星位于同一个轨道平面的两端,单星重访周期为12天,双星同时运行重访周期缩短为6天。Sentinel-1具有4种不同的成像模式:条带模式(stripmap model,SM)、干涉宽幅(interferometric wide swath,IW)模式、超宽幅(extra-wide swath,EW)模式和波模式(wave mode,WM)。其中,IW模式因其覆盖范围大、分辨率适中,从而成为Sentinel-1卫星对地观测的主要工作模式。Sentinel-2也由两颗完全相同的卫星组成。Sentinel-2A与Sentinel-2B分别于2015年6月23日和2017年3月7日发射升空。每个卫星都搭载了一台高分辨率多光谱成像仪(MSI),幅宽达290km,具有13个光谱波段,覆盖可见光、近红外、短波红外波谱范围,包括10m空间分辨率的3个可见光波段和1个近红外波段,20m空间分辨率的3个红边波段、1个近红外波段和2个短波红外波段,以及60m空间分辨率的海岸/气溶胶、水汽和卷积云波段。Sentinel-2A是首颗包含3个“红边”波段的光学对地观测卫星,该波段可以提供有关植被状态的关键信息。两颗卫星处在同一轨道,相位差180°。单颗卫星的重访周期为10天,两星同时运行每5天可完成一次对地球赤道地区的完整成像,而对于纬度较高的地区,这一周期仅需3天。以Sentinel-1和Sentinel-2为代表的高时空分辨率影像为不同尺度的快速地表变化监测和土地覆盖制图提供了新的机会。Sentinel时间序列影像已在草地监测(Rapinel et al.,2019;Shoko and Mutanga,2017)、树种制图(Immitzer et al.,2016)、农作物分类(Belgiu and Csillik,2018;Inglada et al.,2016;Sicre et al.,2016;Vuolo et al.,2018;Waldhoff et al.,2017)等方面得到深入应用。
1.2遥感时间序列分类
在传统的基于时间序列遥感的土地覆盖制图中,*常见的方法是按时间序列堆叠多时空图像,直接使用分类器对原始多时空图像进行分类(Inglada et al.,2017)。使用这种方法的前提假设是默认时间序列影像中像素的光谱值在时间上是相互独立的,图像呈现的时间顺序对结果没有影响,忽略了数据中可能发现的任何时间依赖(Belgiu and Csillik,2018;Ienco et al.,2017;Pelletier et al.,2019)。这种情况下,对于随时间变化的类别,如受季节变化影响的植被生长过程,时间行为没有得到很好的利用。随着遥感大数据分析技术的快速发展,越来越多的研究表明,从时间序列遥感数据中挖掘结构化时间信息对于提高土地覆盖分类具有极大的潜力。基于结构化时间信息挖掘的土地覆盖分类技术大致可以分为三类:①基于时序相似性的挖掘与分类;②基于时序统计特征的挖掘与分类;③基于端到端的深度学习分类。
1.2.1基于时序相似性的挖掘与分类
在时间序列遥感影像堆栈中,每个像元都包含一系列带有时间戳的光谱值,构成具有各自演化特征的时间序列曲线。通过对序列曲线整体形态的相似性比较,来衡量两个时间序列曲线之间的(不)相似程度,进而对序列曲线进行分类。相似性通常用两个序列之间的距离来衡量(Bagnall et al.,2017)。如果两个序列代表相似的演化行为,那么它们的距离应该是接近的。
数据挖掘领域有多种不同形式的距离度量,*常用的距离度量是欧氏距离。Keogh和Kasetty(2003)表明,当在时间序列上应用1-NN分类器时,与其他更复杂的相似性措施相比,欧氏距离在准确性
展开