您的当前位置:华林调节阀网>>调节阀论文>>调节阀设计>>概述PCA_SVM集成阀门故障诊断方法研究

概述PCA_SVM集成阀门故障诊断方法研究

1 概述

调节阀是工业过程中最典型的执行器,广泛用于工业容器和管道系统中,调节阀工作可靠性关系到企业产品的质量以及设备和人身安全,因此,阀门故障诊断和预测显得尤为重要]。然而阀门除了其本体之外,还有复杂的控制部分和执行单元,造成其故障原因和症状很多时候不对应,呈现出复杂的关系,从而不能准确快速的对其进行诊断。文献[5~7]利用BP神经网络对阀门的故障进行识别。文献[8、9]利用支持向量机对阀门故障数据进行模式分类。本文提出一种基于主元分析(PCA)和支持向量机(SVM)分类器的阀门故障诊断方法。首先,通过PCA技术对故障数据进行特征提取并且降低故障数据的维数,利用更少的数据量反映故障特征;其次,利用特征数据建立SVM分类器;最后,将该方法运用到DAMAD ICS阀门仿真模型和Lublin Sugar Factory工业故障数据上。

2 PCA算法

在过程工业的研究中,为了全面的分析问题,往往涉及到众多有关的变量。但是,变量太多会增加计算的复杂度。PCA可以产生数据的低维表示,与用全维观测空间相比,可以更好地推广到独立于训练集的数据。假设X是一个n×m的数据矩阵,其中的每一列对应于一个测量变量,每一行对应一个样本。矩阵X可以分解为m个向量的外积之和,即:

式中 

ti———得分(score)向量,ti∈Rn

pi———负荷(loading)向量,pi∈Rm

T———得分矩阵

P———负荷矩阵

得分向量也叫做X的主元。各个负荷向量实质上是变换的主轴,因此各个负荷向量之间是相互正交,同时每个负荷向量的长度对为1。即:

将式(1)两边同时右乘Pi,再将式(2)代入,则可得到:

式(3)说明每一个得分向量实际上是数据矩阵X在和这个得分向量相对应的负荷向量方向上的投影。如果将得分向量按长度作以下排列:

那么负荷向量p1将代表数据X变化最大的方向,p2与p1垂直并代表数据变化的第二大方向,依次类推。当矩阵X中的变量存在一定程度的线性相关时,数据的变化将主元体现在最前面的几个负荷向量方向上。这样就可以把矩阵X进行主元分解后写为:

式中 

TPT———主元子空间

E———误差矩阵,即残差子空间

对矩阵X进行主元分析实际上等效于对X的协方差矩阵进行特征向量分解。X的负荷向量实际上是协方差矩阵的特征向量,如果将协方差矩阵的特征值从大到小排列,那么与这些特征值相对应的特征向量即为矩阵X的负荷向量。利用上述方法对观测数据进行主元分析计算协方差矩阵的特征值,选取包含85%以上信息量的主元为主要特征向量。

3 SVM分类与故障诊断

支持向量机最初提出是用来处理线性可分问题的。SVM算法的原始形式可归结为求解下面的二次规划问题最小值问题:

该优化问题的解可通过求解拉格朗日函数的鞍点得出,上述问题的拉格朗日函数可以表示为:

式中 

ai———拉格朗日因子

式(7)是一个凸二次规划问题,因此存在唯一的最优解。又由Karush-Kuhn-Tucker(KKT)条件(在鞍点处对偶变量与约束的乘积为0),则式(7)的最优解满足:

利用对偶性原理,拉格朗日函数可转化为求解如下泛函的优化问题:

则最优超平面中的向量w3和3分别为:

最后得到的分类规则函数为:

式中 

xi———支持向量

ai———支持向量对应的拉格朗日因子综合考虑最小化错分样本数和最优推广能力,则式(6)的二次优化问题改为:

其中C>0为常数,称为惩罚系数,用以控制对错分数据点的惩罚程度,ξi可看成训练样本关于广义分离超平面的偏差,ξi=0时即为线性可分的情形,当划分出现错误时,ξi>0,线性不可分,Σξi是训练集中划分错误的向量数的上界,则求解在二值线性不可分情况下的广义最优分类面,就是求解式(12)的二次优化问题,最终转化为与两值线性可分情况下相同的问题。

由于对偶式(9)中只出现两向量间的内积运算,Vapnik等人用满足Mercer条件的核函数k(xi,xj)来代替内积运算,实现线性算法的非线性化。常用的核函数包括多项式核、径向基核以及二层神经网络。核形式的判别函数为:

以上讨论的两分类问题,对于多类分类问题通常有如下几种方法:一类对余类、成对分类、纠错输出编码方法、确定多类目标函数方法等。

从PCA提取的特征向量作为支持向量分类函数fn(x)的输入,建立训练样本集训练SVMn分类模型。SVMn分别判断是否存在故障Fn,如果SVMn输出‘+1’,则存在故障Fn,如果SVMn输出为‘-1’则将数据传送至下一个分类器SVMn+1,以此类推,如果所有分类器都输出‘-1’则按照未知故障处理,将故障数据保存待后续处理。逻辑框如图1所示。

图1 支持向量分类逻辑框示意

4 阀门故障诊断仿真研究

4.1 阀门的基本结构及常见故障描述

阀门由执行机构、调节机构和阀门定位器组成,如图2所示。执行机构将控制器输出信号转换成控制阀的推力,由推力力矩进一步转化为角位移信号;调解机构将位移信号转换为流通面积的变化,从而影响流体流量。阀门定位器可改善控制系统功能,与阀杆位移量组成副回路控制,克服摩擦力、不平衡力和回差干扰。

图2 阀门基本结构

阀门在某段工作时间内连续地保持并完成给定的功能要求,使给定参数值维持在所规定的范围内的这种性能被称为无故障性,当阀门的这种性能受到破坏就会产生故障。常见的故障大致可以归纳19种故障情况,如表1所示。表中同时给出了每种故障的类型及其数学描述模型。

表1 阀门故障描述


4.2 数据的获取及处理

DAMAD I CS模型是一个经典的阀门故障仿真模型,它可以产生各种类型、各种强度的故障数据,还可以将实际工业数据导入到模型中进行仿真。该模型可以产生如表1中的故障。在本文中导入仿真模型的实际工业数据是来自Lublin Sugar Factory某一天一小时内无故障运行数据,针对Lublin Sugar Factory流程种阀门3进行研究,将位号P74-00(阀前压力),P74-01(阀后压力),L74-20X(阀杆的位移),F74-00(阀门的流量),L74-20CV(阀杆位移的设定值)导入模型,然后通过仿真模型加入19种典型的阀门故障得到故障数据。运行每种故障得到100个故障点,得到一个2000个点的数据样本,包含正常和19种故障特征。将采集的数据样本通过PCA处理,从5维的故障数据种提取2维的特征向量,再从中等间距选取200个点,这样减少了样本数就减小支持向量分类器训练的负担。提取的故障特征样本如图3所示。

由图3可以看出并不是所有故障经过特征提取后就可以和正常或者其他故障样本分离开,所以个别故障不可检测,或者不可诊断。分析故障样本选取可检测的10种故障作为接下来故障诊断的研究对象分别为F1,F2,F3,F6,F7,F10,F13,F16,F18,F19。

图3 故障点分布

4.3 SVM分类模型的建立

从PCA提取的特征向量的1100组数据中等间距选取110组样本分别作为正常和10种故障的训练样本,同样也等间距选取110组数据作为测试样本。训练样本集如表2所示。

表2 支持向量分类器训练样本

根据训练样本训练的支持向量分类器效果如图4所示,将测试样本导入建立的分类器模型,故障检测和诊断效果见表3所示,故障检测的正确率可达97.3%,F1,F2,F3,F7,F10,F16,F18,F19故障的诊断效果相比其他传统方法好,但故障F6,F13无法准备诊断,分析原因是检测的变量维数不都多提取的故障特征信息不够多导致这两个故障故障特征相似,只可以诊断出是两种故障中的一种,如需诊断出是两者的哪一种还需要后续研究。

表3 支持向量分类的故障检出率(%)

进一步测试该方法的检测和诊断效果将LublinSugarFactory流程实测故障数据导入该故障诊断模型进行测试。故障数据描述见表4。

表4 LublinSugarFactory流程实测故障检出率

通过仿真数据和实际工业数据的测试,说明该方法可以诊断出典型的阀门故障并具有一定的鲁棒性,与传统的方法相比该方法运用的是小样本建模而且选择的特征向量维数低故检测速度快,检测正确率高。

(a) SVM1

(b) SVM2

(c) SVM3

(d) SVM7

(e) SVM10

(f) SVM18

图4 支持向量分类器

5 结语

仿真试验表明,主元分析和支持向量分类器结合的阀门故障诊断方法可以很快的检测和诊断故障。但是该方法有一定的局限性,对数据的依赖性很强,检测数据维数越高提取的特征信息越多分类效果就越好,这样故障的诊断率就越高,在后续研究中需更深一步地研究阀门的特性,分析故障特征和检测变量的关系,有针对性地选取检测数据提取故障特征。

提出了一种主元分析和支持向量分类器结合的阀门故障诊断及诊断方法,首先对相关度高信息冗余的故障数据进行故障特征的提取得到特征向量,再将特征向量作为支持向量分类器的输入按照阀门的故障类型训练分类函数。该分类器只需少量的故障样本就能够实现阀门故障的快速诊断。