第1章 绪论
可靠性(reliability)一词*早可追溯到20世纪30年代,源于人的品质与产品信誉。国际标准化组织(International Organization for Standardization,ISO)[1]把可靠性定义为:单元在给定的环境和运行条件下,在给定的时间内完成规定功能的能力。这里“单元”既可以是一个元件、设备或者一个子系统,又可以是一个系统;“给定的环境和运行条件”包括使用条件、应力条件、环境条件和储存条件等;“时间”一词也应从广义的角度去理解,可以是时间、次数、里程,如车辆的行驶里程、零件受到的应力循环次数等。在工程技术领域,可靠性概念是第一次世界大战后出现的,首先用在比较军用单缸飞机、双缸飞机及四缸飞机的安全性方面[2],近年来发展到机械技术及现代工程管理领域,成为一个新兴的边缘交叉研究领域。
1.1 可靠性工程发展
可靠性理论诞生于20世纪30~40年代。1931年,Shewhart[3]首先用统计方法分析工业产品的质量与可靠性。随着工业产品综合程度的提高,出现了以电视机、电子计算机、汽车等为代表的机械电子产品,复杂系统的可靠性和安全性已经提到了研究日程。早期,“可靠性”这一概念仅仅从定性方面去理解,没有数值度量。为了准确表述可靠性定义,不仅要从定性来评价,而且需要有定量的尺度。在第二次世界大战后期,德国火箭专家Lusser首先提出用概率乘积法则,将系统的可靠度看成是其各个子系统的可靠度乘积,从而算得V-E型火箭诱导装置的可靠度为75%,首次定量表述了产品的可靠性。
据记载,在第二次世界大战末期,美国空军运到远东地区的电子系统有60%发生故障,海军舰艇的电子设备有70% 处于故障状态。美国率先研究可靠性工程问题,将可靠性设计贯穿于产品的研制、生产、使用和维修的全过程,并成立了各种研究可靠性组织,如1950年的导弹可靠性委员会小组,1952年由军方、工业界及学术界组建的AGREE,于1957年提出著名的AGREE报告,即Reliability of Military Electronic Equipment[4],为可靠性工程技术奠定了基础。日本在1956年从美国引进可靠性技术,并将可靠性技术推广到民用工业部门,取得了很大成功,极大程度上提高了产品的可靠度,从而提高了产品的竞争力,如汽车、电视、照相机等产品畅销全球并带来了巨大的经济效益。
20世纪60年代初,美国洲际弹道导弹和太空开发计划的发展,尤其是墨丘利计划和双子星计划的推进,以及和苏联在外太空方面的军备竞赛,使人类首次登上了月球,这给可靠性的发展提供了良好的契机[5]。1962年,英国出版了Reliability and Microelectronics杂志,法国国立通信研究所在这一年成立了“可靠性中心”,进行数据的收集与分析。1963年,国际上著名的可靠性专业学术杂志IEEE Transaction on Reliability问世。1964年,第一届可靠性学术会议在匈牙利召开,开始了对可靠性理论与应用的研究工作。1965年,国际电工委员会(International Electrotechnical Commission,IEC)设立了可靠性技术委员会,对可靠性的研究,由航空、宇航、电子等尖端工业领域扩展到电力、机械、土木等一般性产业部门,使得可靠性工程和技术得到迅速发展[6]。
在20世纪70年代,美国和其他一些国家开始大力发展原子能。美国成立了以Rasmussen为首的研究小组,开展对原子能安全风险评估方面的工作,数百万美元研究经费的投入造就了世界上第一份原子能安全风险评估报告,即著名的Rasmussen报告[7-9]。70年代初,我国航空航天工业部提出电子元器件必须经过严格筛选,70年代中期,中日海底电缆工程的需要推动了高可靠性元器件验证试验,促进了我国可靠性工程的发展。
20世纪80年代末至90年代初,在以科技为先导,质量为主线的方针指导下,以可靠性理论及工程应用为主的“北京航空航天大学可靠性与系统工程学院”、致力于微电子和元器件失效机理与分析新技术的“中国赛宝实验室(信息产业部电子第五研究所)可靠性研究分析中心”,以及新兴的以可靠性理论研究为主的“电子科技大学可靠性工程研究所”等重要科研院所先后成立[5]。国家军用标准《电子设备可靠性预计手册》(GJB/Z 299B—98)和《电子设备非工作状态预计手册》(GJB/Z 108—98)为开展可靠性预计提供了一系列参考数据和科学的技术方法[6],应用于国内军用、民用及航空航天部门,助推了人造卫星、洲际导弹试验和同步通信卫星的成功发射,标志着我国可靠性工程和技术的研究取得了显著的成就,缩短了国内与国际先进的可靠性技术水平的差距。
可靠性作为衡量产品质量的一个重要指标,实质上是度量产品在时间维度上的质量。一个产品若不可靠,其高性能与强功能对顾客来说都是毫无意义的,而且会威胁财产生命安全,或导致灾难性事故发生。洛克希德飞机坠毁事故、福特汽车公司Pinto汽车的漏油事故、凡士通公司的轮胎事故等[10],反映了产品在设计阶段需要充分考虑可靠性相关问题。随着可靠性研究的不断深入,以及现代高科技复杂系统产品发展的需要,研究过程经历了20世纪50年代的起步阶段,70年代的成熟阶段,90年代的向智能与自动化发展的阶段,到21世纪已发展到面向全寿命、全过程、全特性的综合集成阶段,逐步形成了一门综合性的可靠性工程技术学科。
近年来,欧洲和亚洲各国在工业系统的可靠性和安全性方面同样也做了大量有意义的工作[7, 10],如挪威海洋石油天然气及北海石油天然气的开发,使得深海设备可靠性问题成为和航空航天设备一样的研究热点。
1.2 可靠性基本概念
在现代生产中,可靠性技术已贯穿于产品的初期研制、设计、制造、试验、使用、运输、保养及维修等各个环节。从经济角度分析,为提高产品的利用率,减少维修费用,高可靠性是必要的,但高可靠要求的费用较高,因此需要综合考虑优选部件设计问题,以便使得总费用取得*佳可靠度。
在应用概率统计相关方法研究系统可靠性时,总把产品发生的故障规律看成随机现象来研究,因此通常的可靠度不是指某一特定产品的可靠程度,而是针对该型号产品总体的可靠程度。可靠性理论在发展过程中形成了四个独立学科领域[11]。
(1) 可靠性数学。它是可靠性研究中*重要的基础理论之一,主要研究和解决各种可靠性问题的数学方法和数学模型,研究可靠性的定量规律,属于应用数学范畴,所涉及的知识主要有概率论、数理统计、随机过程、运筹学及拓扑学等数学分支,多数应用于数据收集与分析,以及系统设计与寿命试验等方面。
(2) 可靠性工程。该领域首先面对产品这个实体对象,可为零部件、元器件、设备或系统,从而说明可靠性工程是对产品的失效与其发生概率进行统计分析,以及对产品可靠性设计、预计、试验、评估、检验、控制、维修及失效分析的一门包含许多工程技术的边缘性学科。该学科立足于系统工程理论与方法,应用概率统计等方法对产品的可靠性问题进行定量分析,采用失效分析方法与逻辑推理对产品故障进行研究,找出薄弱环节,确定提高产品可靠性的途径,综合权衡经济、功能等方面的得失,将产品的可靠性提高到满意程度的一门学科。该学科包含了对零部件和系统等产品的可靠性数据的收集与分析、可靠性设计、预测与评价等。
(3) 可靠性物理。又称为失效物理,是研究失效的物理原因与数学物理模型,检测方法与纠正措施的一门可靠性理论。它使可靠性工程从数理统计方法发展到以理化分析为基础的失效分析方法。从本质和机理上探究产品的不可靠因素,从而为研究、生产高可靠性产品提供科学依据和试验机理。
(4) 可靠性管理。主要是指为确定和满足产品可靠性要求而必须进行的一系列计划、组织、协调、监督等工作,从制订设计方案、分配、优化等对产品或系统进行管理,对管理成功性提出概率和行为要求的软科学。
在可靠性工程中,现场使用数据与试验数据的收集整理,多数国家建立了各种数据库,因为数据是可靠性设计和可靠性研究的基础,在整个可靠性工程中,都是通过可靠性数据和信息反馈来改进产品的可靠性,于是存在可靠性设计这个重要的内容。
可靠性设计是可靠性工程的一个重要分支,因为产品的可靠性在很大程度上取决于设计的正确性,在可靠性设计中要规定可靠性和维修性指标,并使其达到*优[12]。可靠性预计则是可靠性设计的重要内容之一,是一种预测预报方法,在设计阶段,从失效率数据预报零部件和系统实际可能达到的可靠度,预计这些零部件和系统在规定的条件下和规定的时间内完成规定功能的概率。在设备设计的初期,及时完成可靠性预计工作,可以更清楚地了解元器件之间的可靠性关联关系,找出提高整个设备可靠度的有效途径。而可靠性设计的另一个重要内容则是可靠性分配,它是将系统规定的容许失效概率合理分配到系统的零部件,通常采用*优化方法进行系统的可靠性分配。在可靠性设计中,有时会采用冗余设计法,该方法是在系统中配置备用零部件或子系统,当原来部件或设备出现故障时,立即替换储备件,通常采用并联和旁联冗余,该方法可以成倍地提高系统可靠度。
可靠性设计中核心为机械可靠性设计,也称为机械概率设计,是工程可靠性在机械设计中的应用[13]。由于可靠性理论扩展到结构设计、强度分析、疲劳研究等方面,传统的机械设计方法不能预测零部件的破坏概率,主要是因为所采用的荷载和材料性能等数据为平均数据。选用强度时还要考虑安全因子,相比之下,机械可靠性设计则更为接近于实际情况。机械可靠性的设计特点是采用可靠度或其他可靠性指标,确保系统的结构可靠性,而传统的机械设计则是用安全因子来保证结构可靠性的,因此,机械可靠性设计方法对失效可能性的认识和估计都是比较合理的。从结构安全性评价来看,传统机械设计只有安全因子这样一个指标,而机械可靠性设计则有可靠度和安全因子两个指标。
*早可靠性定义是由AGREE在1957年的报告中提出的,1966年,美国的MIL-STD-721B正式给出了传统和经典的可靠性定义,即产品在规定条件下和时间内完成规定功能的能力,它将可靠性定义分为任务可靠性和基本可靠性两部分[6]。任务可靠性的定义为产品在规定的任务剖面内完成规定功能的能力,反映产品在执行任务时成功的概率,只是统计危及任务成功的致命故障。基本可靠性定义为产品在规定条件下,无故障持续时间或概率,包括全寿命单位的全部故障,能反映产品维修人力和后勤保障等要求。
可靠性的理论基础是概率论和数理统计,其任务是研究系统或产品的可靠程度,提高质量、经济效益和生产的安全性。具体地,上述可靠性定义中,含有以下五个方面的因素[13~15]。
(1) 研究对象。可靠性研究的对象为产品,是一个广泛概念,可以是元件、组件、零件、部件、单元、机器、设备,乃至整个系统。研究可靠性时部件要确定具体产品,而且要明确其内容和性质。若研究对象为系统,则应包括硬件、软件,以及人的判断和操作等因素在内,即人机系统观点分析问题。
(2) 规定条件。包括使用时的环境条件和工作条件,如温度、湿度、振动、冲击、辐射等环境条件,使用时的应力条件、维护方法、储存时的储存条件,以及使用时对操作人员的技术等级要求等。在不同的规定条件下产品可靠性是不同的,如同一型号飞机在不同天气条件飞行表现的可靠性不完全一样,从而若要谈论产品的可靠性必须指明规定的条件是什么。
(3) 规定时间。它是指产品规定了的任务时间。随着产品任务时间的增加,产品出现故障的概率将增加,而产品的可靠性将会下降。因此,谈论产品的可靠性离不开规定的任务时间。不同类型的产品对应的时间单位可能不同,如火箭发射装置,其可靠性对应的时间以秒计算,而海底通信电缆寿命则以年计。时间单位不一定仅为年月日,时分秒,也可以是工作次数(如开关继电器等)、滚动循环次数(如发动机寿命)和
展开