第1章绪论
1.1引言
随着科技的进步与发展,系统的自动化程度和复杂度越来越高,规模越来越大。一方面,人们对系统的研究不断深入,研究对象逐渐从静态系统向动态系统、从确定性系统向随机系统转变,研究的数学工具从单纯的数据处理方法转变为基于状态空间方程的解析模型方法。另一方面,人们对系统性能提出了更高的要求,系统的可靠性和安全性日益引起人们的关注。现今,系统的稳定性和可靠性已经成为自动化系统设计中*为重要的问题之一,为了提高系统的稳定性,传统的方法是采用质量更高和稳定性更好的系统组件,然而这些组件并不能保证系统始终处于无故障的运行状态。虽然在这些性能更强的组件支持下,系统能够在长时期内保持正常工作,但是间歇故障时有发生,严重威胁着系统的安全性和可靠性。
根据IFAC安全过程技术委员会给出的定义,故障是指系统的参数或特性超出了通常的或标准的范围。根据故障持续时间不同,系统故障可进一步被划分为永久故障和间歇故障(见表1.1)。永久故障指的是:假设故障一旦出现,除非通过某种干预来消除,否则故障将永久存在。尽管关于这方面的研究已经取得了大量的成果,但是永久故障的发生意味着系统性能已经下降,如果系统不能得到及时维修,则不能消除故障带来的隐患。随着现代技术的快速发展,针对间歇故障(Intermittent Fault,IF)的研究正受到越来越多的关注。按照IEEE标准术语词典的定义间歇故障是一种由于同一种原因而反复出现,每次持续时间有限,且不经外部补偿措施可以自行消失,从而使系统重新恢复可接受性能的故障。
对于一个存在间歇故障的系统,在间歇故障活跃时,系统可能会产生错误结果;在间歇故障不活跃时,系统又将输出正确结果。间歇故障具有随机性和累积性,表现为在线检测时可被发现,而离线检测时则难以发现,随着时间的推移,间歇故障的幅值、频率和持续时间会逐渐变大,*终可演变为永久故障。在没有得到及时处理的情况下,间歇故障的表现形式如图1.1所示,在故障发生的初始阶段,幅值较小,类似于微小的噪声和干扰,随着时间的推移,故障的幅值与持续时间逐渐增加,表现出明显的间歇性,逐渐演变为严重的间歇故障,*终可能会演变为永久故障,甚至引发灾难性事故。
由于缺乏有效的检测技术,系统故障往往直接危害现代工业系统的安全可靠运行,带来巨大的经济损失甚至危害人民群众生命安全。例如,2008年,一架美军B-2隐形轰炸机自关岛空军基地起飞时坠毁,原因是该轰炸机外部24个传感器中的3个受潮发生故障,造成飞机控制系统功能紊乱,其直接经济损失达14亿美元;2011年“7.23”甬温线重大铁路交通事故的部分原因是雷击导致通信设备故障,且检测故障不准导致故障不能及时维修,其直接经济损失达19371.65万元,且造成40人死亡,172人受伤;在2018年10月29日和2019年3月10日,印度尼西亚狮子航空公司和埃塞俄比亚航空公司的两架737MAX8客机相继在执飞商业航班过程中失事,失事的两架飞机很可能是因为迎角探测器在高速环境下出现故障,导致获得的迎角信号过大,错误地触发了机动特性增强模式[3];此外,2019年泉城站“11.22”爆燃事故是因变压器高压套管故障引发爆燃,事故造成1人死亡,2人重伤。在以上案例中,由于运行时间增加,工作环境恶劣以及设计缺陷等,系统性能水平明显低于正常水平,难以完成预期功能,也说明了系统在实际运行过程中难免发生故障。鉴于间歇故障具有演变为永久故障的风险,若能对间歇故障很好地检测,可以起到对永久故障的预防作用,从而在不破坏系统性能的情况下及时维护和维修。
因此,随机动态系统的间歇故障诊断技术研究具有重要意义。随机动态系统的故障诊断主要包括三个方面:故障检测、故障分离、故障估计。故障检测是指确定故障是否发生和故障发生的时间;故障分离是对不同的故障进行定位和分类;故障估计主要是确定故障的大小。精确诊断间歇故障的幅值、故障活跃时间、故障间隔时间、故障发生时间和消失时间等数字特征具有重要意义。如图1.2所示,若间歇故障建模为脉冲形式,则h为间歇故障幅值,T!和分别为间歇故障的发生时刻和消失时刻,d,和d2分别为间歇故障的活跃时间和间隔时间。首先,需要精确检测间歇故障的发生和消失,由于间歇故障随机发生和消失,当检测到故障发生后,可能在对系统的进一步研究中,故障已经消失,按照传统的故障检测逻辑,可能误将系统诊断为无故障,从而使系统长期运行在间歇故障环境下,对系统危害极大;其次,若间歇故障的幅值较小且活跃时间较短,频繁的停机检修会带来生产效率的下降和维修成本的增加。尽管间歇故障在许多领域都很常见,但是现有的故障检测方法大多不能精确诊断间歇故障的以上特征,专门针对间歇故障以上特征进行的研究很少,这主要是因为间歇故障的检测与永久故障的检测相比,更加困难。
检测环节是故障诊断的首要环节,尽管早在20世纪70年代就有人对间歇故障开展了研究,但是系统性的间歇故障检测理论一直不够丰富和完善,主要原因是间歇故障不同于永久故障,关于永久故障的相关理论不能直接应用于间歇故障,其主要检测难点在于以下几个方面。
(1)检测实时性要求高。间歇故障检测不仅要在故障消失前检测到故障的发生时刻,还要在下一次故障发生前检测到故障的消失时刻。而间歇故障的持续时间很短,发生时间随机,所以要求间歇故障的检测具有良好的实时性。
(2)早期故障检测困难。间歇故障早期的幅值小,故障症状不明显,容易湮没在噪声和系统不确定性干扰中,导致检测困难。
(3)离线检测困难。不同于永久故障可以离线测试,间歇故障的出现条件不清晰,难以被激活,对其线下检测需要大量的测试资源,因此不宜做离线检测。
传统的故障诊断技术经过多年发展已经较为成熟,在众多的故障诊断技术中,基于解析模型的方法以现代控制理论为基础,依托日益发展的计算机技术,对在线精确检测故障具有独*优势。同样地,间歇故障作为其中一种故障形式,也可以利用基于解析模型的方法进行研究。近年来的研究表明,基于解析模型的方法使得间歇故障的检测精度更高,而检测技术的进步促进了人们对解析模型构建的系统有更深入的理解。从根本上讲,间歇故障检测的目的不仅仅在于分析系统性能以检测间歇故障,而且要判断系统基本动态特性是否允许间歇故障被检测,在系统的解析模型已经建立的情况下,得到关于间歇故障可检测性的一些基本结论,进一步地,分析间歇故障的可分离性与定位问题。因此,基于解析模型的间歇故障检测研究对认识间歇故障工作机理、指导间歇故障的检测具有重要意义。
针对不同的目标和采用不同的技术,往往能建立不同的系统解析模型,这也是各种基于解析模型的间歇故障检测技术的主要区别。根据系统的解析模型不同,间歇故障的检测理论主要经历了线性定常系统到线性时变系统的间歇故障检测研究过程;而系统中的未知扰动、随机时滞等问题使得间歇故障检测的复杂度增加,在此方面,含有未知扰动的线性时变系统的间歇故障检测理论得到进一步的完善。此外,针对非线性系统,间歇故障检测技术得到了初步的研究,但是由于非线性系统的间歇故障难以像线性系统那样与状态变量等解耦,非线性系统的间歇故障检测尤为困难,目前的理论成果尚不完善。
综上所述,基于解析模型的间歇故障检测理论在探讨间歇故障的可检测性,设计间歇故障的检测、分离和定位方法等方面具有明显的优势,对防止早期故障演变为永久故障具有重要意义。但目前仍缺乏间歇故障检测理论较为系统的总结,本书旨在总结基于解析模型的间歇故障检测理论,以期在此方面有更大突破。
1.2研究背景
由于间歇故障具有自我恢复能力,起初对间歇故障的研究并没有像永久故障一样得到太多的关注。但在电子工业中间歇故障经常发生且难以解释其发生原因,随着对系统安全重视程度的提高,人们对间歇故障的发生机理和检测技术的研究表现出了越来越多的需求。2008~2014年,IEEE组织了9次主题为“预测与健康管理”和“预测与系统健康管理”的国际会议,将间歇故障诊断这一研究领域推向新的研究热潮,为了更清楚地说明这一增长趋势,本书作者于2022年3月15日在WebofScience数据库中进行了相关文献检索,首先以“intermittent fault”或“intermittent faults”为关键词进行了主题和标题的精确检索,注意这里的关键词均包括引号,确保搜索结果的精确性,之后又以这两个关键词进行了主题和标题的模糊检索,检索结果如表1.2所示。将检索范围限定为2010~2021年,图1.3显不了检索结果主题精确含有“intermittent fault”或“intermittent faults”关键词的文献数量大体呈上升趋势,具有波动式上升的特点。图1.4显示了其间主题中模糊包含intermitttent和fault词汇的相关文献数量,不仅在数量上远多于精确检索结果,上升趋势也更为明显,在2016~2020年相关文献尤其多。近年来,随着间歇故障诊断问题在线性系统方面的突破和人工智能技术的发展,相关文献数量增长较快,然而微小间歇故障,以及非线性系统的间歇故障诊断问题等研究难度大,目前尚缺乏相关成果。
1.2.1电子电路系统
电子电路中故障分为永久故障、瞬时故障与间歇故障[4]。在电子电路系统中,永久故障指的是不可以自发地从故障状态回到正常状态的故障,对系统的正常工作有持续影响;瞬时故障通常是由粒子辐射、电磁波或者电源波动引起的故障,且发生是瞬时的,一般不是元件故障;间歇故障可以自动地从故障状态回到正常状态,一般情况下,间歇故障一旦发生,就会在某一位置反复发生。瞬时故障和间
展开