第1章 绪论
随着科学技术的飞速发展,网络、计算、数据、知识共同驱动着社会经济各领域持续创新发展。尤其是随着新一代信息技术的蓬勃崛起,我国相继提出了“互联网+”和“智能+”行动计划,使得信号与信息处理、计算机和自动控制等领域的重要性日益突出。陆海空天及工业过程的实际环境复杂多变,信息在传播过程中不可避免地混杂随机噪声或其他干扰信号。因此,对信号噪声进行处理的滤波理论及其技术的研究成为现代信息学科领域一个重要的研究方向。
滤波也称为状态估计。滤波就是从混杂在一起的信号中提取有用信息的技术,它是控制理论、计算机技术和概率论与数理统计的交叉产物。以现代控制理论为基础,基于线性系统模型和白噪声假设、基于*小均方误差准则的滤波算法及其优化算法在目标跟踪、信息融合、图像处理,以及导航与制导等诸多领域获得广泛应用。然而,在实际应用中,需要通过通信网络进行信息的接收和发送。在这个过程中,网络可能会受到系统本身和外界环境中的诸多不确定性因素的影响,如非高斯噪声(混合高斯噪声、散射噪声等)、非完整信息(异常值、数据缺失)等。基于*小均方误差准则的滤波算法及其优化算法对上述不确定因素的影响比较敏感,使得滤波算法在稳定性、鲁棒性等方面遇到挑战,导致滤波算法性能降低,甚至发散。因此,开展针对实际工程中含有诸多不确定因素的滤波问题研究,具有重要的理论意义和实际应用价值。
在现实世界中,不存在真正意义上的线性系统。实际系统都是非线性系统,而且大多数系统具有强非线性特性。因此这类系统很难利用线性微分方程或差分方程来描述,如惯导系统、卫星姿态控制等。非高斯噪声、非完整信息等复杂情况下的非线性系统的状态估计问题也是当前研究的热点和难点。
本书以导航系统的应用需求为背景,分别从线性系统与非线性系统、高斯噪声与非高斯噪声两个角度来进行滤波方法介绍。
1.1 Kalman滤波理论基础
信号是传递和运载信息的时间或空间函数。信号有两类,即确定性信号和随机信号。确定性信号的变化规律是既定的,可以表示为一确定的时间函数或空间函数,具有确定的频谱特性,如阶跃信号、脉宽固定的矩形脉冲信号、正余弦函数等,它们对于指定的某一时刻,可确定一相应的函数值。随机信号没有既定的变化规律,不能给出确定的时间或空间函数,在相同的初始条件和环境条件下,信号每次实现都不一样,如陀螺随机漂移、随机海浪等。随机信号没有确定的频谱特性,但是具有确定的功率谱,可以通过统计特性来描述其特征。
信号在检测与传输过程中不可避免地要受到外来干扰与设备内部噪声的影响,为获取所需信号,排除干扰,就要对信号进行滤波。信号的性质不同,获取有用信号的方法就不同,即滤波的手段不同。对于可用频谱特性描述的确定性信号,可根据信号所处频带的不同,设置具有相应频率特性的滤波器,如低通滤波器、高通滤波器、带通滤波器及带阻滤波器等,使有用信号尽可能无衰减地通过,而干扰信号受到抑制。这类滤波器可用物理的方法实现,即模拟滤波器,也可用计算机通过特定的算法实现,即数字滤波器。对确定性信号的滤波处理通常称为常规滤波。
随机信号具有确定的功率谱特性,可根据有用信号和干扰信号的功率谱设计滤波器。美国学者维纳(N. Wiener)等提出了Wiener滤波,他们通过功率谱分解设计滤波器,在对信号进行抑制和选通这一点上同常规滤波是相似的。由于在频域进行Wiener滤波器设计,要求解维纳-霍普方程,计算量较大。
Kalman滤波是匈牙利裔美国数学家鲁道夫?埃米尔?卡尔曼(Rudolf Emil Kalman,1930—2016)于1960 年提出的,是一种从与被提取信号有关的观测量中通过算法估计出所需信号的滤波方法。他把状态空间的概念引入随机估计理论中,把信号视为白噪声作用下的一个线性系统的输出,用状态方程来描述这种输入-输出关系,估计过程中利用系统状态方程、观测方程和白噪声激励(系统噪声和观测噪声)的统计特性构成滤波算法,由于所利用的信息都是时域内的变量,所以不但可以对平稳的、一维的随机过程进行估计,也可以对非平稳的、多维随机过程进行估计。这就避免了Wiener滤波在频域内设计时遇到的困难,适用范围比较广泛。
实际上,Kalman滤波是一套由计算机实现的实时递推算法,它所处理的对象是随机信号,利用系统噪声和观测噪声的统计特性,将系统的观测量作为滤波器的输入、所要估计值(系统的状态或参数)作为滤波器的输出,滤波器的输入与输出由时间更新和观测更新算法联系在一起,根据系统状态方程和观测方程估计出所有需要处理的信号。因此,此处所谈的Kalman滤波与常规滤波的含义与方法完全不同,实质上是一种*优估计方法。下面对Kalman滤波的基础理论——估计理论进行详细阐述。
1.1.1 滤波与估计
在随机控制和信息处理过程中,通常观测信息中不仅包含所需信号,而且还包含随机观测噪声和干扰信号。通过对一系列带有观测噪声和干扰信号的实际观测数据进行处理,从中得到所需要的各种参量的估计值,这就是估计问题。在工程实践中,经常遇到的估计问题有两类:①系统的结构参数部分或全部未知,有待确定;②实施*优控制需要随时了解系统的状态,而由于种种限制,系统中的一部分或全部状态变量不能直接测得。也就是这两类估计问题——参数估计和状态估计。
一般估计问题都是由估计验前信息、估计约束条件和估计准则三部分构成的。若设:
(1)为维未知状态或参数,为其估计值。
(2)为与有关的维观测向量,它与的关系可表示为
(1.1)
(3)为维观测噪声,它的统计规律部分或全部已知。
则一般地,估计问题可叙述为:给定观测向量和观测噪声向量的全部或部分统计规律,根据选定的准则和约束条件(1.1),确定一个函数,使得它成为(在选定准则下)的*优估计,即
(1.2)
在应用中,总是希望估计出来的参数或状态越接近实际值越好,即得到状态或参数的*优估计。为了衡量估计的好坏,必须要有一个估计准则。估计准则以某种方式度量了估计的精确性,它体现了估计是否*优的含义。很显然,估计准则可能是各式各样的,*优估计不是唯一的,它随着准则不同而不同。因此,在估计时,要恰当地选择衡量估计效果的准则。估计准则一般用函数来表达,在估计问题中称这个函数为指标函数或损失函数。
一般来说,损失函数是根据验前信息选定的,而估计式是通过损失函数的极小化或极大化导出的。不同的损失函数,导致不同的估计方法。原则上,任何具有一定性质的函数都可用作损失函数。从估计理论的应用实践看,可行的损失函数只有少数几种。目前估计中常用的三类准则是直接误差准则、误差函数矩准则和直接概率准则。
直接误差准则:以某种形式的误差为自变量的函数作为损失函数的准则,如估计误差或对的拟合误差(是的函数)。在这类准则中,损失函数是误差的凸函数,估计式是通过损失函数的极小化导出的,而与观测噪声的统计特性无关。因此,这类准则特别适用于观测噪声统计规律未知的情况。*小二乘估计及其各种推广形式都是以误差的平方和*小作为估计准则。
误差函数矩准则:以直接误差函数矩作为损失函数的准则。特别地,可把损失函数选作直接误差函数,以其均值为零和方差*小为准则。在这类准则中,要求观测噪声的有关矩是已知的,显然它比直接误差准则要求更多的信息,因而可望具有更高的精度。*小方差估计、线性*小方差估计等都是属于这类准则的估计。
直接概率准则:这类准则的损失函数是以某种形式误差的概率密度函数构成的,有时也用熵函数构成。估计式由损失函数的极值条件导出。由于这类准则与概率密度有关,这就要求有关的概率密度函数存在,而且要知道它的形式。极大似然估计和极大验后估计就是这类准则的直接应用。
选取不同的估计准则,就有不同的估计方法,估计方法与估计准则是紧密相关的。相应于上述三类估计准则,常用的估计方法有*小二乘估计、线性*小方差估计、*小方差估计、极大似然估计及极大验后估计等。
在估计问题中,常考虑如下随机线性离散系统模型:
(1.3a)
(1.3b)
式中,下标k为采样时间;是系统的维状态序列;是系统的维观测序列;是系统的维随机干扰序列;是系统的维观测噪声序列;是系统的状态转移矩阵;是干扰输入矩阵;是观测矩阵。在以后的讨论中,省略条件。
根据状态向量和观测向量在时间上存在的不同对应关系,可以把估计问题分为滤波、预测和平滑,以式(1.3)所描述的随机线性离散系统为例,设表示根据时刻和以前时刻的观测值,对时刻状态做出的某种估计,则按照和的不同对应关系,分别叙述如下。
(1)当时,对的估计称为滤波,即依据过去直至现在的观测值来估计现在的状态。相应地,称为的*优滤波估计值,简记为。这类估计主要用于随机系统的实时控制。
(2)当时,对的估计称为预测或外推,即依据过去直至现在的观测值来预测未来的状态,并把称为的*优预测估计值。这类估计主要用于对系统未来状态的预测和实时控制。
(3)当时,对的估计称为平滑或内插,即依据过去直至现在的观测值来估计过去的历史状态,并称为的*优平滑估计值。这类估计广泛应用于通过分析实验或实验数据,对系统进行评估。
若把换成,换成,则上述分类对于连续时间系统同样适用。换句话说,线性系统的状态估计都可分成以上三类。
在预测、滤波和平滑三类状态估计问题中,预测是滤波的基础,滤波是平滑的基础。本书主要讨论滤波问题。
1.1.2 线性*小方差估计
线性*小方差估计,就是在已知被估计量和观测量的一阶矩、二阶矩,即均值,方差和协方差的情况下,假定所求的估计量是观测量的线性函数,以估计误差方差阵达到*小作为*优估计的性能指标(损失函数)的估计方法。
假定估计是观测量的线性函数,即设
(1.4)
式中,为与同维的非随机向量;为具有相应维数的非随机矩阵。
记估计误差为
则选择向量和矩阵,使得下列平均二次性能指标
(1.5)
达到极小,此时得到的*优估计就称为线性*小方差估计,并记为。
将使达到极小的和记为和,则有
(1.6)
因此,只要求解和,就可以由式(1.6)得到。
为了求和,将对和求偏导。由于是向量和矩阵的标量函数,考虑到微分运算和期望运算是可交换的,可得
(1.7)
(1.8)
令式(1.7)和式(1.8)等于零,即可求得和。令式(1.7)等于零,得
(1.9)
将式(1.9)代入式(1.8),并令式(1.8)等于零,可得
即
所以
(1.10)
将式(1.10)代入式(1.9)得
(1.11)
将式(1.10)和式(1.11)代入式(1.6)得
(1.12)
式(1.12)就是由观测值 求 的线性*小方差估计的表达式。
线性*小方差估计 具有如下性质:
(1)线性*小方差估计 是无偏估计,即
(1.13)
(2)估计误差的方差阵为
(1.14)
(3)任何一种线性估计的误差方差阵都将大于或等于线性*小方差估计的误差方差阵。
该性质的说明如下:设 的任一线性估计可表示为 ,则此估计的误差方差阵为
如果令
则可得
(1.15)
显然,任一线性估计的误差方差阵与 和 的选择有关。由于式(1.15)等号右边的**项和第二项都是非负定的,因此
(1.16)
式(1.16)说明,任何一种线性估计的误差方差阵都将大于或等于线性*小方差估计的误差方差阵。由此可见,线性*小方差估计具有*小的方差阵。
展开