1.4 故障诊断技术概述

1.4.1 故障诊断的含义

诊断(Diagnosis)一词原是医学名词,是医生收集病人症状,并根据症状进行分析处理,以判断患者的病因、严重程度,从而确定对患者的治疗措施与方案的过程。设备诊断技术借用了上述概念,是指利用各种检查方法和监视手段,通过对设备运行中各种特性的测量,了解及评估设备在运行过程中的状态,从而能早期发现故障的技术。其中,特征量的收集过程称为状态监测。诊断指故障诊断,含义是指特征量收集后的分析判断过程。设备的故障诊断有离线诊断和在线诊断,其目的是及时发现设备的潜在故障,通过分析故障形成原因,预防故障的进一步发生;尽可能排除设备故障,保证设备安全稳定运行,可靠发挥设备功能。

设备的故障诊断技术发展源于20世纪60年代,美国是最早研究的国家之一。自1961年执行阿波罗计划后,因设备故障造成的一系列事故促使美国宇航局倡导,由美国海军研究室主持成立美国机械故障预防小组,从事诊断技术的研发工作。20世纪六七十年代,英国机器保健和状态监测协会开始研究故障诊断技术。我国是在1979年才初步接触设备诊断技术,目前在化工、冶金、航空、电力等领域有较好的应用。由于故障诊断技术是在基本不拆卸设备或设备运行中,了解设备的使用状态,确定设备正常与否,进而早期辨别设备的故障原因并制定相应的处理措施,因此对于提高设备安全经济运行具有重要意义。经过多年的研究和现场运行考核,国内外很多公司已成熟地开发出了设备状态监测与故障诊断系统,并进行了广泛的应用,如美国西屋公司的GEN-AID系统使得克萨斯州的7台发电机组的强迫停机率由1.4%降到0.2%,平均可用率从95.2%升高到96.1%;英国CEGB公司下属的550M W和660M W发电厂因机组故障每年损失750万英镑,应用故障诊断技术后,通过对机组振动故障原因的5次正确分析,就获得直接经济效益293万英镑。设备故障诊断技术经过半个世纪的发展,在理论上和实际上均取得很多进展。

1.4.2 故障诊断系统的性能指标

1.检测性能指标

(1)早期检测的灵敏度:指一个故障检测系统对最小故障信号的检测能力。

(2)故障检测的及时性:指对象发生故障后,故障检测系统能够在尽可能短的时间内检测到故障发生的能力。

(3)故障的误报率和漏报率:系统没有发生故障却被错误的判定为出现故障的情形称为误报;系统中出现了故障却没有被检测出来称为漏报。

2.诊断性能指标

(1)故障分离能力:指诊断系统对于不同故障的区分能力。分离能力强的系统,对故障的定位也就越准确。

(2)故障辨识的准确性:指诊断系统对故障大小、发生时刻以及随时间变化特性估计的准确性。故障辨识准确性高的系统,有利于对故障的评估和决策。

3.综合性能指标

(1)鲁棒性:指故障诊断系统在存在干扰、噪声、建模误差等情况下正确完成故障诊断,并保持满意的漏报率和误报率的能力。鲁棒性高的诊断系统,其可靠性越高。

(2)自适应能力:指当被诊断对象变化时,故障诊断系统具有自适应能力,并且可以利用变化中产生的新信息改善自身性能的能力。

1.4.3 故障诊断的基本方法

对于设备的运行管理,早期是发生故障后再维修,称为事后维修;但对于大型复杂设备系统,这种突发性故障将造成巨大损失。其后,发展为定期试验和检修。定期试验和检修是离线进行的,所以无法随时监测设备,判断准确度有限。而设备故障诊断技术是以运行状态监测和故障诊断为基础的设备状态维修,因此在采取状态监测与故障诊断技术后,可以使设备由预防性维修向预知性维修(即状态维修)过渡,从到期必修过渡到该修则修,提高了设备运行效率和可靠性。

经过半个世纪的发展,故障诊断技术的发展大致经历了三个发展阶段。第一阶段,主要依靠专家或维修人员的个人经验和简单的仪表工具,实现一些简单设备的故障诊断;第二阶段,融合了传感器技术、动态测试技术及信号分析等方法,提高了故障诊断的准确度;第三阶段,智能故障诊断阶段,在前者的基础上应用了神经网络、模糊理论、遗传算法、粗糙集理论、数据挖掘、专家系统等计算机技术和人工智能技术,使故障诊断技术逐渐向智能化方向发展,实现复杂生产设备的故障诊断,给技术人员对大型设备的预知维修提供更便利的条件。

现有常用的故障诊断方法可分为基于解析模型的方法和不基于解析模型的方法。基于解析模型的方法可分为状态估计法、参数估计法和等价空间法等;不基于解析模型的方法可分为基于信号处理的方法和基于知识的方法等。故障诊断方法的分类如图1-6所示。

1.4.3.1 基于解析模型的方法

此方法是最早发展起来的,一般需要建立被诊断对象的较为精确的数学模型。该类方法应用在线系统辨识技术为系统实时的建立数学模型,当系统发生故障时,系统的输入输出关系就会改变,这些变化会反映到数学模型中,因此通过观测系统数学模型的参数变化,就可以判断系统是否存在故障。它可进一步分为状态估计法、参数估计法和等价空间法。这三种方法虽是独立发展起来的,但它们又存在着一定的联系。

1.状态估计法

系统的运行状态可以通过被控对象的状态变量反应,因此通过估计出系统状态,并与适当模型结合就可以进行故障诊断。其基本思想是重构被控过程的状态。通过与可测变量比较构成残差序列,由于残差序列中包含各种故障信息,再构造适当的模型并用统计检测法,就可从残差序列中把故障检测出来,并做进一步分离、估计及决策。所谓残差,就是与被诊断系统的正常运行状态无关的、由其输入输出信息构成的线性或非线性函数。在没有故障时,残差等于零或近似为零(在某种意义下);而当系统出现故障时,残差应显著偏离零点。1971年,Beard首先提出故障诊断的检测滤波器的概念,标志着基于状态估计的故障诊断方法的诞生。状态估计的获得通常可用各种状态观测器或滤波器实现,如卡尔曼滤波器法、自适应观测器法等。

2.参数估计法

如果参数的显著变化可以描述故障,那么就可以利用估计参数值技术,根据参数的估计值与正常值之间的偏差情况来判断系统的故障情况。参数估计法根据模型参数及相应的物理参数的变化量序列统计特性,来进行故障检测、分离和估计。1984年,Iserman对于参数估计的故障诊断方法作了完整的描述。图1-7为基于参数估计的故障诊断框图。常用的参数估计法有最小二乘法、跟踪滤波法等。

图1-6 故障诊断方法分类示意图

3.等价空间法

等价空间法的基本思想是通过系统输入、输出的实际测量值检验被诊断系统数学关系的一致性,从而进行故障诊断。等价空间法包括奇偶方差方法、方向性残差方法和约束优化的等价方程等方法。

1.4.3.2 基于信号处理的方法

当被控对象的输入输出信号可以获得,但很难建立诊断对象的解析模型时,可以采用基于信号处理的方法进行故障诊断。此类方法的主要思想是:对于采集到的信号,利用信号分析理论获得系统时域和频域中较深层次的多种特征向量,利用这些特征向量与系统故障源之间的关系判断故障源的位置。这种方法回避了建立对象数学模型的难点,而直接利用信号模型,如相关函数、高阶统计量、频谱和自回归滑动平均过程以及热门的小波分析等技术,直接分析可测信号,提取方差、均值、幅值、相位、峭度、散度、频谱等特征值,从而识别和评估设备的状态。此方法主要用于诊断对象的解析模型难以建立,但系统的一些状态或者输出参数可以测量的系统。

图1-7 基于参数估计的故障诊断框图

1.输入输出信号阈值简单判别法

在正常情况下,被控过程的输入输出信号应在正常范围内变化。通过测量系统的输入信号和输出信号,当不在正常范围时,可以认为系统故障。还可通过测量输入输出信号的变化率,分析是否满足正常的范围,从而判断是否有故障发生。

2.输出信号处理法

系统输出的信号与故障源之间可能会在频率、相位、幅值、相关性等方面存在一定联系,利用一定的信号处理的数值计算方法,对信号进行变换、综合,可以揭示这些特征量,来判断故障源所在。常用的方法有傅里叶频谱分析法、功率谱分析法、相关分析法等。例如,采用谱分析对比诊断的基本原理就是将典型状态下监测信号通过各种数学变换的谱图和故障谱图用数据库形式存放在计算机中,在诊断过程中,通过谱图的寻找和对比,研究状态变化和参量分布,参照谱数据库得出诊断结论。

3.基于小波变换的方法

小波变换是一种全新的时间一尺度分析方法,具有灵敏度高、克服噪声能力强的特点。小波变换的基函数是一系列尺度可变的函数,具有良好的时间一频率定位特性。对信号进行小波变换,适当的选取小波尺度,在这些尺度上的小波基进行信号的重构,去掉高频、工频噪声段的小波尺度,可以保证这些重构的信号只包含系统运行信息和故障信息。主要方法有利用测量信号的奇异性进行故障诊断;利用测量信号的频率结构变化进行故障诊断等方法。

4.基于信息融合的方法

这是一种局部诊断-全局融合的故障诊断方法。为了充分利用检测量所提供的信息,首先对每个检测量采用多种诊断方法进行诊断,这一过程称为局部诊断,然后将各诊断方法所得的结果加以综合,得到系统故障诊断的总体结果。目前融合故障诊断方法有贝叶斯(Bayes)推理、D-S证据理论、神经网络融合等。

5.基于信号模态估计的方法

依据系统的死循环特征方程求解与物理参数变化的根轨迹集合,任取一死循环信号采用最小二乘法估计系统的模态参数,最后利用模式识别技术将估计模态与根轨迹进行匹配,从而实现故障分离。

6,统计诊断分析法

运用贝叶斯公式算出某种征兆特定故障引起的概率,进而判别故障类型。这个方法必须要考虑被诊断对象的运行历史状况,以获取各种故障发生的概率变化情况,为各种故障确定先验概率。统计诊断法容易发生错报和漏报,只有在观测样本较多的情况下效果较好。

1.4.3.3 基于知识的方法

在工程实践中,对象的精确数学模型是无法得到的,这就大大限制了解析方法的使用范围。而基于知识的方法恰恰不需要对象的精确数学模型,因此具有很强的生命力。随着人工智能技术的发展,专家系统、模糊技术、神经网络技术、知识工程等被引入到过程控制中,进一步应用到故障诊断领域。

1.基于专家系统的故障诊断法

专家系统是人工智能领域非常活跃的分支。这种方法不依赖于系统的数学模型,而是根据专家长期的实际经验及大量故障信息知识、分析问题和解决问题的思路,建立故障诊断的知识库、规则库和推理机,设计一个计算机程序,根据知识库的知识,规则库的规则及推理机的推理机制,进行推理和故障诊断。

2.基于神经网络的故障诊断法

神经网络技术以分布的方法存储信息,利用网络的拓扑结构和权值分布来实现非线性映射。在神经网络的故障诊断系统中,只需要用该领域专家解决问题的实例或样例来训练网络。神经网络结构确定、权值学习好后,可以由代表故障症状的输入数据,直接推出代表故障原因的输出数据。

3.基于模糊逻辑的故障诊断法

模糊集合、模糊运算、模糊逻辑系统对模糊信息有强大处理能力,由于故障征兆是界限不分明的模糊集合,故障诊断的机理非常适合用模糊规则来描述,使模糊逻辑的方法成为故障诊断的一种有力工具。

模糊诊断将某类故障发生时的所有征兆构成征兆群空间,将引起某种故障的所有原因构成一个故障原因空间,故障原因必然会与征兆空间中的某些征兆群相对应。当把故障原因看做征兆空间的模糊子集时,故障诊断的问题就是确定征兆空间的某个元素(即征兆)以多大程度隶属于哪个模糊子集(即故障原因)的问题。一般用隶属度来描述这种程度的大小。求出隶属度的最大值,就得到了诊断结果。模糊诊断是一种很有前途的诊断方法,但过程中隶属函数的确定有一定难度,精确性的高低取决于统计资料的准确性和丰富程度,以及专家的实际经验。

4.基于故障树分析的故障诊断法

故障树是应用于可靠性分析的一种方法,现已广泛应用于故障诊断领域。利用故障的层次特性,将故障的成因和后果关系形成一串有很多层次的因果链,加上一因多果或一果多因,就构成了描述故障的故障树。故障树的诊断方法依靠准确的故障树结构,而故障树的建立需要对系统机理的深入了解。故障树分析法是一种图形演绎的诊断方法,是通过对可能造成系统故障的各种因素(包括硬件、软件、环境、人为因素等)进行分析,画出逻辑框图(即故障树),再对系统中发生的故障事件,由总体至分支按树结构逐级分析,其目的是判明基本故障,确定故障原因、故障影响和发生概率等。

5.基于图论的模型推理方法

将系统元件定义为图的节点,利用元器件之间的影响关系将系统模型化为图,然后进行故障诊断。基于图论的故障诊断方法主要有基于符合有向图的诊断方法和基于故障传播的诊断方法。

6.故障模式及后果分析诊断法

故障模式影响及后果分析是故障诊断分析中一个极为重要的方法。故障模式影响及后果分析(FMEA)是通过分析零部件各种故障模式对整个系统的影响,来鉴定产品的可靠性或确定故障原因的一种分析方法。它可用于零部件或整机系统的分析中,有利于将故障影响减少到最低限度。由于需要分析涉及系统的所有组成部分,所以工作量会随着系统的复杂程度而加大。

7.基于灰色理论的故障诊断方法

基于灰色理论的故障诊断的主要思想是将预测系统看作是一个灰色系统,然后用已知的信息来预报含有故障模式的不可知信息的特性、状态以及发展趋势,预报未来的故障。灰色理论包含灰色预测、灰色关联度分析、灰色聚类以及灰色决策。其中灰色关联度在故障诊断中应用最为广泛,其实施过程为:首先建立故障标准模式特征向量矩阵,然后获取实测信号的待检测特征向量,求出待检测特征向量与标准特征向量的关联度,并进行由大到小的排序。若待检测模式序列与某一标准模式序列的关联度最大,则认为待检测模式为该类故障模式。

8.粗糙集理论故障诊断分析法

粗糙集理论是一种处理模糊和不确定知识的新型数学工具,它的最大特点是不需要提供求解问题时所需处理的数据集合之外的任何先验信息(如统计中要求的先验概率和模糊集中要求的隶属度),就能有效地分析和处理不确定、不一致、不完整等各种不完备数据,并从中发现隐含知识,揭示其潜在规律。

一般来说,人工智能及其他复杂信息处理问题均以分类作为它们的基本机制之一,粗糙集理论就是建立在分类机制的基础之上的,它将分类理解为等价关系,而这些等价关系将对待定空间进行划分。粗糙集理论将等价关系对空间的划分与知识等同,即将知识理解为对数据的划分,而被划分的集合称为概念。

故障诊断技术是一门以数学、计算机、自动控制、信号处理、仿真技术、可靠性理论等有关学科为基础的多学科交叉的综合性学科。故障诊断技术发展至今,已经出现了基于不同原理的众多方法。如何利用提出的大量故障诊断方法,将多种故障诊断方法有效结合,充分地获取知识、利用知识,进而提高故障诊断系统的性能将成为故障诊断方法研究的热点。