第1章 绪论
空间故障网络(space fault network,SFN)理论是空间故障树(space fault tree,SFT)理论体系的第三部分,主要用于描述系统故障演化过程(system fault evolution process,SFEP),并分析因素、事件、故障数据等的相互关系。SFN理论研究涉及安全科学、系统科学、智能科学、大数据科学及信息科学等多方面,同时涉及矿业系统的灾害过程研究。
1.1 研究工作的意义和目的
无论是自然系统灾害还是人工系统故障都不是一蹴而就的,而是一种演化过程,即SFEP。自然系统指遵从自然规律,非人工建立的系统;其灾害指影响人们生产生活的自然灾害,如冲击地压、滑坡等。人工系统指按照一定目的遵从自然规律的人造系统,如飞机、压缩机等;其故障指系统完成预定能力时出现的下降或失效。SFEP宏观表现为众多事件遵从一定发生顺序的事件组合;微观则表现为事件之间的相互作用,具有复杂的网络结构[1-5]。然而,各领域故障的影响因素、故障过程和过程数据通常不同,使得SFEP具有多样性,给研究和干预SFEP带来了巨大困难[1,2,5]。另外,在系统层面研究SFEP,其内部事件及结构关系、影响因素作用和故障数据处理方式等具有模式上的相似性,这为SFEP抽象和分析提供了切入点。下面结合当前研究现状及作者前期研究给出工程背景及研究意义。
(1) 某型飞机设计阶段似乎没有充分研究飞机使用过程的环境因素(如温度、湿度、气压、使用时间等)对可靠性的影响,导致实际使用故障频出,严重影响了原设计试图实现的功能[6]。这些飞机的飞行及维护过程数据是被信息化平台实时记录的,这些数据蕴含着系统故障及其特征。然而,由于缺乏相应的SFEP分析方法,特别是早期生产的该型飞机,故障率非常高[7]。上述事实表明,系统运行出现的故障数据并未得到有效分析,导致飞机故障发生过程中各元件失效、各元件之间意外交互、失效因果关系及失效传递情况分析困难,致使SFEP分析失败[1,2]。同样,问题也出现在高寒高海拔地区高铁故障过程分析中[8]。高寒高海拔地区高铁运行的速度、时间和运量与一般情况不同。不同环境对高铁运行故障的影响不同,因此高铁前期研制和运行测试阶段累积的大量数据为保证高铁的SFEP分析起到了关键作用。在深海中高压低温潜航设备的SFEP研究也同样存在这类问题[9]。
(2) 文献[10]给出了三级往复式压缩机的第一级故障过程描述。作者已对该过程进行了归纳和研究,得到图1.1所示的SFEP。由图可知,压缩机第一级SFEP与众多元件及事件相关。这些元件故障的发生至少受到温度和压力因素的影响;同时,故障特征蕴含在实时监测的数据中。因此,需要通过故障数据和影响因素分析各元件失效、意外交互、失效因果关系及失效传递情况。然而,目前缺乏相应的SFEP分析理论和方法。
图1.1 三级往复式压缩机的第一级SFEP
(3) 作者前期研究的冲击地压过程是一个复杂的动力系统演化过程,如图1.2所示。影响因素很多,单纯通过力学实验和现场数据而不在系统层面研究,一般难以有效诠释煤(岩)体变形、裂隙发展、飞石抛射和坍塌的复杂SFEP[11]。从实地
图1.2 不同深度冲击地压演化过程
矿井收集的冲击地压数据较多,利用现有方法分析各阶段事件及影响因素较为困难。在不清楚各事件的逻辑关系及各因素作用的情况下,难以进一步研究冲击地压过程演化。
(4) 研究露天矿区灾害演化时涉及的灾害因素和监控数据较多,主要有地表变形、水污染和大气污染等重点灾害;它们与开采活动、水、火、震动等几大类几十项因素之间是相互交织的复杂网络关系[12]。作者通过前期研究得到露天矿北帮各类灾害的SFEP,如图1.3所示。现有方法难以描述这些灾害演化过程、确定影响因素、分析灾害数据、划分阶段和抽象特征,使下一步研究和防治面临极大困难。
图1.3 露天矿北帮各类灾害的SFEP
飞机、高铁等失效属于人工系统故障,而冲击地压和矿区灾害属于自然系统灾害,这些故障和灾害过程是普遍存在的。在系统层面上,这些故障和灾害过程的内部事件及结构关系、影响因素作用和故障数据处理方式等具有模式上的相似性,均可抽象为SFEP。在面对多影响因素、故障数据量大且多样、SFEP多变等问题时,现有分析方法难以胜任。因此,研究SFEP分析及干预方法对工矿、交通、医疗、军事等复杂且关系到生命财产和具有战略意义的领域更为重要。SFEP已成为安全科学、系统科学、数据科学及智能科学交叉研究的重点方法之一,但目前仍存在不足:①多因素变化影响SFEP,元件材料物理属性随环境因素的改变导致SFEP中各事件发生情况改变,使SFEP具有很大的不确定性。②SFEP的故障数据具有模糊性、离散型和随机性,但总体上有规律。故障数据作为SFEP分析的基础可定量分析,但系统复杂且SFEP难以划分时缺乏有效的数据分析方法。③SFEP描述过程受故障数据、影响因素、故障演化网络形态、事件与因素关系等限制,在安全科学领域难以独立展开研究。④针对不同领域系统故障干预措施不同,SFEP急需系统层面的结构性干预机制和措施。
上述问题的实质是:针对普遍存在的SFEP,缺乏系统层面有效且普适的抽象和分析方法,这是安全领域研究必须面对的关键科学问题。需要安全科学与数据、系统、智能科学的知识融合,来研究SFEP分析及干预方法。因此,建立一种符合上述要求的SFEP描述和分析方法具有重要的理论和实际意义。
SFEP分析方法是安全科学与数据、系统和智能科学交叉研究的产物。从日常工矿生产到航空国防领域都要了解SFEP并采取必要措施加以干预。传统故障分析方法不适合复杂SFEP特征、故障数据因果推理和多影响因素的分析,难以满足当前智能处理和数据环境要求。满足要求的分析方法应具备智能处理、故障特征数据分析、复杂SFEP抽象、SFEP干预等能力。作者创立系统级故障演化过程普适分析方法,并建立了SFN理论。研究目的在于为各类自然及人工系统故障过程研究提供普适的分析方法和防治措施。
1.2 相关研究现状和存在的问题
1.2.1 故障过程的网络描述
无论是自然灾害还是人工系统故障,都具有一定的因果关系。研究该过程对分析灾害和故障机理具有重要意义。完成这项工作首先要面对的问题是如何描述故障发展过程,如何分解复杂过程,如何衡量并表示该过程,哪些因素影响过程的发展。这些问题都可抽象为一些事件按照一定逻辑关系相继发生的过程。理解该过程并对该过程进行描述、建模、分析,*终找到防止故障或灾害发展的手段,对当前的生产生活具有重要意义。然而,这一过程需要结合安全科学、数据科学、智能科学及系统科学的相关理论和知识,仅凭借安全科学自身无法解决上述问题。目前已有一些理论和方法可在一定程度上解决上述问题,并得到了有益的成果。徐力[13]研究了动车组故障模式(fault mode,FM);韩治中等[14]对飞行器突发故障演化模型进行了设计和仿真;谭晓栋等[15]对机械系统的故障演化进行了研究;郝泽龙[16]对基于复杂网络理论的电网连锁故障模型进行了研究;王文彬等[17]对基于三阶段故障过程的多重点策略优化模型进行了研究;沈安慰等[18]研究了竞争性故障模型的可靠性评估方法;王建华[19]对具有混合故障模型系统的可靠性进行了分析;李艳[20]对网络上的多策略演化动力学进行了研究。同时,人们对故障演化过程的研究较少,主要包括孙冰等[21]的创新生态系统演化研究,刘新民等[22]的城市交通系统演化研究,王继红等[23]基于突变论的企业系统演化研究,Barafort等[24]的软件空间结构演化研究,Zylbersztajn[25]的企业制度演化研究,Fuxjager等[26]的行为过程演化研究等。以上这些研究也存在不足之处,对故障发展过程的描述一般都是定性的,且很少进一步研究故障发展过程机理,缺乏定量分析手段。作为该问题的先期研究,作者提出了SFT理论,主要用于多因素影响下的系统可靠性分析,进一步将智能科学和大数据技术融入其中,对SFT理论进行智能化改造。随着对实际工程问题的深入研究,人们发现无论是自然灾害还是人工系统故障都是复杂的演化过程。这种演化表现为众多事件按照一定的逻辑关系连接成网络,因此SFT理论难以适用。
在SFEP中,导致*终故障发生的事件有很多。对SFEP的起因及*终故障发生情况的研究是要解决的关键问题。目前,故障模式研究包括Wang等[27]的基于故障模式的冗余驱动系统容错控制,Mellit等[28]、Lu等[29]、Boutasseta等[30]的光伏系统故障检测与诊断方法,Sonoda等[31]的基于人工免疫系统的故障识别,Lee等[32]的发动机故障检测与诊断算法,Al Dallal等[33]的故障数据完整性对预测故障倾向的影响,Acharya等[34]的容错无线传感器网络数据融合,Fravolini等[35]的飞机空气数据传感器鲁棒性故障检测等。这些研究由于领域不同,考虑的故障事件、影响因素、逻辑关系不同,导致了各自采用的方法和理论不同。虽然取得了较好的效果,但缺乏从系统层面研究SFEP的方法论。因此,这些方法在不同种类系统间缺乏通用性,对通用SFEP研究造成了阻碍。无论是自然灾害过程还是人工系统故障过程,都可分解为*基本的组成要素,从而在系统层面描述并研究演化过程。
SFEP中演化的含义是事物发展的时间规律。因此,研究SFEP的时间发展规律和特征是SFN理论的重点内容之一。演化过程的时间特征在于各事件的发生与后继事件的发生是否有同时存在的可能,是否在该事件发生后的持续时间内可导致后继事件的发生。如果在时间上存在重叠,那么原因事件才可导致结果事件发生。另外,在SFN中事件也存在重复现象,一是同一个边缘事件可导致多个故障演化过程,二是同类边缘事件可导致多个故障演化过程。在这两种情况下,边缘事件的发生导致*终事件发生的概率不同。需要研究这些边缘事件的发生过程和时间特征来计算*终事件的发生概率。对SFEP中的重复事件及演化时间特征的研究更为少见。其原因在于,现有SFEP分析多是定性的,难以定量计算。系统演化描述方法与故障系统演化过程特征不一致,难以进行有效描述。目前,安全系统工程领域并未出现可描述SFEP的理论框架。然而,实际的人工系统故障,特别是自然灾害演化过程却与时间因素密切相关。同时,自然灾害演化过程中各事件的连接是网络结构,存在较多重复事件,这些重复事件在演化过程中的作用目前较少研究。
1.2.2 网络的表示与逻辑关系
SFEP普遍存在于各行各业,影响系统可靠性。该过程经历众多事件,也受到很多因素影响,使演化过程具有多样性。这些多样性都是系统发生故障的模式,每一种模式都是一种可能,只是可能性不同。实际SFEP只是其中一种可能。因此,如何分析SFEP的所有可能性,判断哪一种演化*易发生,对保障系统安全运行、维持可靠性具有重要意义。
目前人们对SFEP的研究逐渐增多[25-35],对系统的结构表示和分析方法研究相对较少,但在医疗领域[36]、工程项目管理[37]、软件评估[38]、健康分析[39]、监控视频分析[40]、并行结构分析[41]、教学活动分析[42]等方面都有涉猎。这些研究一般针对具体行业,基于行业和学科的基本特征进行研究。然而,通常抽象程度不够,难以形成具有普遍意义的SFEP表示及逻辑关系分析方法。
1.2.3 网络中事件的重要性和故障模式
在网络中事件重要度的研究方法有很多。这些研究一般都是将实际网络根据学科背景抽象为网络结构,主要包括结构重要度[43]、因果重要度[44,45]和节点重要度[46,47],也包括通信网络节点重要度[48]、无标度网络节点重要度[49]、客运网络节点重要度[50,51]等的研究。这些方法一般具有具体技术背景,难以通用。特
展开