第1章 绪论
本章*先介绍复杂系统健康监测的技术背景。其次,详细地对深度学习进行介绍,包括起源、内涵、研究现状及应用领域等。然后,通过综述现有的复杂系统异常状态感知、故障诊断和剩余使用寿命预测方法及其研究现状,深入分析现有方法的优势与不足。*后,结合复杂系统的异常状态感知、剩余使用寿命预测和故障诊断的实际需求,提炼出复杂系统健康监测的技术难点。
1.1 研究背景
制造业是国民经济的主体,是立国之本、兴国之器和强国之基。经过七十多年的快速发展,我国已经成为世界**制造大国,形成了全球*大、*长且相对完整的产业链,规模稳居世界**。然而,伴随着全球经济结构的深度调整,我国工业化进程步入后期、人口红利逐步消失及人口老龄化,以前依靠劳动力成本、能源资源、土地等比较优势发展起来的制造业正面临着严峻的挑战,迫切需要实现制造业转型升级。2021年3月11日,十三届全国人大四次会议通过的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》指出:要深入实施制造强国战略,提升制造业核心竞争力,推动制造业高质量发展[1]。2022年10月,习近平总书记在党的二十大报告中也指出:要加快建设制造强国。
当前,全球主要的工业大国相继提出了本国的制造业发展战略,如日本《互联工业战略》(2017年)、德国《国家工业战略2030》(2019年)、美国《先进制造业国家战略》(2022年)等。这些战略强调智能制造系统是推动制造业数字化、网络化、智能化转型的关键要素。
智能制造系统是一类集成物联网、人工智能、大数据、制造云等高新技术的复杂系统,主要包括制造装备、物料运输、作业控制等子系统及加工刀具、轴承、齿轮箱、滚珠丝杆等关键功能部件。它具有自主性的感知、学习、分析、预测、决策、通信与协调控制能力,通过制造过程的深度感知、智慧决策和精准控制,实现提质增效、节能降本的目标。不过,智能制造系统运行时由于不断地受到各种环境作用力(如切削力、摩擦力、环境温度、振动)的影响,以及运动副磨损、零件的锈蚀、器件的老化等导致其健康状态不断退化,工作效率和性能逐渐下降,若不进行及时维护,*终将失效(无法满足工作需求)甚至引发严重故障,从而给企业带来巨大的损失[2]。据不完全统计,目前因制造系统故障导致的维修成本和停机损失已经占到企业生产成本的30%~40%。为了保证智能制造系统的长时间安全可靠运行,迫切需要智能制造系统健康监测技术,实现对其健康状态的实时监测、诊断与预测,以尽早地识别系统故障状态,精准地诊断系统故障原因,自适应地预测系统运行寿命,从而提前采取有效的措施避免系统故障突发。
智能制造系统的组成部件众多、互相关联,且运行工况多变、故障模式多样、故障样本匮乏等诸多特点使得智能制造系统健康监测面临巨大的挑战。幸运的是,智能制造系统上密集布置了众多的传感器,如振动传感器、温度传感器、噪声传感器和电参数传感器等,可以便捷地采集系统健康监测数据,监测数据量与日俱增。例如,西安陕鼓动力股份有限公司的一套空压机组集成了振动、温度、流量、压力等传感器,包含了336个测量数据点,实时原始状态数据量达到10 MB/s,同时还有业务数据(机组档案、现场服务记录等)和知识数据(质量数据、测试数据等),总量约为1 TB,且每日平均增量约为5 MB。中联重科股份有限公司在工程机械上加装了大量的高精度传感器,监控设备数12万余台(套),实时采集设备的运动特征、健康指标、环境特征等数据,存量数据量达到40 TB,每月新增数据300 GB。中国联合网络通信集团有限公司针对某公司生产车间内的机床、环境等各种影响产品质量的因素进行了监测,监测数据涵盖应力、表面温度、传输压力、传输流量等,单车间采集传感器超过1 000个,每日采集数据量超过824 GB。由此可见,智能制造系统健康监测已经进入工业大数据时代[3]。
工业大数据时代下的智能制造系统健康监测具有以下特点。
(1)数据规模大且类型多样化。智能制造系统可以采集的监测数据量越来越大,且数据种类越来越多。例如,数控机床的监测数据主要包括进给轴状态数据(电流、位置、速度、温度)、主轴状态数据(功率、扭矩、速度、温度)、机床运行状态数据[输入/输出(input/output,I/O)、报警和故障信息]、机床操作状态数据(开机、关机、断电、急停)、加工程序数据(程序名称、工件名称、刀具、加工时间、程序执行时间、程序型号)及传感器数据(振动信号、声发射信号、切削力信号)等。这些数据规模达PB级,是工业大数据的主要来源。然而,如何从海量多样的监测数据中挖掘出能反映系统健康状态变化的信息是一项极具挑战性的任务。
(2)数据更新快且价值密度低。智能制造系统健康监测数据采样频率高,目前有些传感器监测数据的写入速度可以达到百万个数据点每秒至千万个数据点每秒。例如,南京爱尔传感科技有限公司的AE-H高频动态压力传感器*大频率可达2 MHz,即每秒采集200万个数据点。不过,包含有系统故障特征的异常状态监测数据量极少;相反,大部分的监测数据均是在正常运行状态下采集的,包含了大量的高度重复信息,价值密度低。如何及时有效地从海量监测数据中捕捉到有价值的特征是一项亟待解决的问题。
(3)数据强关联与因果性。智能制造系统的不同类型监测数据从多个维度反映智能制造系统健康状态的变动情况,这些监测数据之间存在较强的关联与因果性。例如,通常采集振动信号、温度信号及润滑油金属碎片颗粒数等,对齿轮箱健康状态进行监测。当齿轮箱发生故障时:一方面其振动信号将立即出现波动,润滑油温度逐渐升高,润滑油中金属碎片颗粒数也将不断增加;另一方面其故障发生是由破齿、齿片脱落和裂纹、固定盘松动等引起的。如何从监测数据中挖掘出数据关联性,揭示出内在的因果关系是一项具有挑战性的任务。
(4)数据多模态与跨尺度性。智能制造系统不同部件的监测数据不仅数据格式差异大,而且数据结构多。例如,航空发动机的高压涡轮冷却引气流量、核心机转速、高压压气机出口总压、风扇入口红外图谱等监测数据在数据结构上有巨大的区别,这给不同模态的监测数据融合带来了巨大的困难。此外,将来源于设备、车间、工厂、供应链及社会环境等不同空间尺度的数据,以及毫秒级、分钟级、小时级等不同时间尺度的数据进行集成与分析也是一项艰巨的任务。
由此可见,工业大数据时代下的智能制造系统健康监测面临的挑战是如何从海量监测数据中自动挖掘和提取特征。伴随计算能力的持续提高和新型算法的不断涌现,深度学习取得了突破性发展。例如,2020年1月谷歌(Google)旗下的深度思想公司(DeepMind)在《自然》(Nature)上发布了一个新型的钼靶影像人工智能系统,它通过集成3个深度学习模型开展钼靶影像的大数据分析和处理,实现乳腺癌早期筛查。结果显示:该人工智能系统在乳腺癌预测方面表现出优异的性能,甚至超越了人类专家。深度学习通过构建深层网络拓扑结构,从海量监测数据中自动挖掘特征信息,计算过程无须人工设计数据特征,解决了传统数据分析方法耗费时间长及数据特征通用性差的问题。深度学习的不断发展及其与工业大数据的融合将为复杂系统健康监测技术的突破注入新的机遇。
1.2 深度学习简介
1.2.1 深度学习的起源
深度学习是一种高级机器学习算法,其起源可以追溯到人工神经网络(artificial neural network,ANN)模型的诞生。1943年,美国神经生理学家McCulloch和数学家Pitts[4]*次提出McCulloch-Pitts(M-P)模型。M-P模型是一种模仿生物神经元结构和工作原理的神经网络模型。该模型被学术界认定为人工神经网络的起源。随后,加拿大神经心理学家Hebb[5]在1949 年通过分析神经元学习法则,提出一种基于无监督学习的规则,即Hebb规则。Hebb规则为神经网络的学习算法发展奠定了坚实的基础。1957 年,美国神经学家Rosenblatt结合M-P模型和Hebb规则设计了一种类似于人类学习过程的学习算法,即感知机。感知机是一种线性分类模型,模型输入数据的特征向量,可以实现二分类,输出为 + 1或?1二值。换句话说,感知机可以通过特征分析判断样本数据属于哪个类别。感知器理论的提出具有里程碑式意义,激发起了大量科学家对人工神经网络的兴趣。1969年,Minsky和Papert[6]在《感知器:计算几何学导论》(Perceptrons:An introduction to computational geometry)中对感知机进行了进一步研究,证明了单层感知机无法实现非线性分类。感知机的这项缺陷导致人工神经网络研究陷入一段时间的低迷期。
1982年,美国物理学家Hopfield[7]将物理学的相关思想与神经网络相结合,设计了Hopfield神经网络。该网络是一种递归神经网络,每个神经元与其他神经元之间均保持连接。该网络可以模拟人类的记忆,根据激活函数的选取不同,可以用于优化计算或联想记忆等任务,但该网络也存在易陷入局部*小值的缺陷。1986年,Rumelhart 等[8]提出了反向传播(back propagation,BP)算法,在数据正向传播的基础上,添加了误差的反向传播。因此。神经网络可以根据反馈的误差不断地调整模型参数,直到误差小于设定阈值或训练次数超过预定值。BP算法在非线性分类问题上的应用使得神经网络再次引起广泛的关注。然而,当时计算机技术难以支撑大规模神经网络的运算,模型训练过程中容易出现梯度消失问题,严重制约了其发展。
2006年,Hinton和Salakhutdinov[9]*次提出了深度学习的概念,并在《科学》(Science)上发表论文《利用神经网络降低数据维度》(Reducing the dimensionality of data with neural networks),在该论文中Hinton和Salakhutdinov提出梯度消失问题的解决方法,具体为先利用无监督学习算法逐层训练,再使用有监督的反向传播算法进行调优。该方法的提出,立刻受到了学术界的高度关注,许多知名高校和科技企业开启了深度学习的研究,并逐渐在医疗诊断、机器视觉、自然语言处理等领域取得了显著的成果。
1.2.2 深度学习的内涵
深度学习属于机器学习的子领域,本质上是一种基于多层表达与抽象的特征学习,每层对应一个特定的特征,高层特征取决于低层的特征,且同一低层特征有助于确定多个高层特征。它通过模拟人脑视觉信息处理机理,将原始数据通过一些简单且非线性的模型转变成更高层次的、更加抽象的特征表达。通过足够多的转换组合,非常复杂的函数(特征)都可以被学习。由此可见,深度学习的主要思想是利用深度神经网络逐层自动捕捉数据特征,将低层的输出结果作为高层的输入,在高层进一步捕捉更为抽象的特征来表征目标,以揭示输入和输出间的映射关系。深度学习依托深度神经网络,实施数据特征学习和数据表达,*终实现数据分类和回归等任务。
图1.1为传统人工神经网络和深度神经网络示意图。深度神经网络是在传统人工神经网络的基础上,通过增加隐藏层节点的层数而得到的模型,是一个典型的深度学习模型。不同于传统的浅层学习模型,深度学习模型具有以下特点。
图1.1 传统人工神经网络和深度神经网络示意图
(1)模型结构的层次深。深度学习模型通常有少则几个,多则上百个隐藏层,这些隐藏层按照一定的规则相互连接,能更全面且深入地提取特征,具有极强的特征提取能力。
(2)特征逐层学习。深度学习模型利用非线性数据变换,将输入数据转化到新的特征空间,从而更容易地实现分类或回归。
(3)从数据到结果的端到端学习。深度学习模型直接从输入数据出发,不断地计算模型输出与样本标签的误差,通过反向传播的总体误差,不断地优化参数。
1.2.3
展开