利用相关系数图选择振动信号特征值的方法

2020-07-31 07:01李志勇赵红东梅检民
现代电子技术 2020年15期
关键词:皮尔逊互信息供油

李志勇,赵红东,梅检民,沈 虹

(1.河北工业大学 电子信息工程学院,天津 300401;2.陆军军事交通学院 基础部,天津 300161;3.陆军军事交通学院 投送装备保障系,天津 300161)

0 引 言

通过在机体表面安装振动传感器采集振动信号对机械装备进行工作状态监测,是目前使用较多的一种非侵入式信号检测方法,在发动机故障识别中得到了应用[1⁃2]。当发动机处在某一工作状态时,经由安装在发动机上的振动加速度传感器采集振动信号,在时域、频域或者时频域[3⁃4]提取振动信号的相应特征参数,利用其实现故障识别。本文是基于利用柴油机气缸缸盖表面振动加速度信号识别柴油机高压油路供油系统故障的实验展开的。为了提高系统工作的实时性,避开频域、时频域相对复杂的运算过程,以及相应处理对改变背景信号和相关信号分量的影响[5],这里只对实验数据提取时域特征值,求出各特征值之间的相关系数,选出相关性较大的特征值构建相关系数图,兼顾实际数值,分别构建阈值为0.9 和0.87 的皮尔逊相关系数图对特征值进行筛选,在利用缸盖顶部振动信号、利用阈值为0.9 的皮尔逊相关系数图优化振动信号特征值选择、利用阈值为0.87 的皮尔逊相关系数图优化振动信号特征值选择这三种情况下,用相应的时域特征值构造故障特征向量集作为GRNN 的输入,进行故障识别,比较并选定皮尔逊相关系数图中的相关系数阈值,选出识别率较高者,即为选定的基于相关系数图的振动信号特征值选择方法。

1 相关系数及特征参数

相关系数是高维数据降维时使用的一种基本方法,较为常用的有皮尔逊相关系数(Pearson Correlation Coef⁃ficient,PCC)和最大互信息系数(Maximal Information Coefficient,MIC)。PCC[6⁃7]可以很好地度量变量间线性相关性,以统计学为基础,数学计算过程简单、准确。变量X 和Y 的PCC 取值范围是[-1,1],值越大表明变量X和Y 的线性相关程度越高。值为1 时,X 和Y 完全正相关;值为-1 时,X 和Y 完全负相关;值为0 时,X 和Y 无关。MIC[8⁃9]以信息论中的互信息为基础,既可以度量变量间的线性相关性,也可以很好地度量变量间的非线性相关性。变量X 和Y 的MIC 取值区间为[0,1],且X 和Y 相关程度越高其值越大。

以潍柴WD615 第6 缸高压油路为研究对象,缸盖顶部安装振动加速度传感器,在供油正常、漏油轻微、漏油严重、断油各工况下,分别采集振动信号74 组、62 组、97 组、50 组。每种工况下取曲轴角-90°CA~90°CA 截取振动信号,提取如下时域特征值:信号峰值、绝对峰值、峰峰值、均值、绝对均值、均方根值、方差、标准偏差、方根幅值、峭度指标、偏度指标、峰值指标、波形指标、脉冲指标、裕度指标、自相关系数峰值、各工况信号相对于正常供油信号互相关系数峰值,分别用C1~C17表示。

2 皮尔逊相关系数图的构建

汽车故障诊断系统工作前首先要标定正常工作时的相关数据信息,作为初始信息,用以比对实际工况下传感器采集的实时信息,实现故障分类识别。因此,在不同工况下有效信号的选择是基于汽车在正常工作状态下参数与特征的选择,其他三种工况下的数据选择规则应与正常工况下的数据选择规则相对应。本文对有效信号的选择方式就是从高压油路供油正常情况下的振动信号选择入手的。为体现普遍性,随机选取正常工况下20组数据讨论相关系数图的建立和使用。对振动信号提取的每一个时域特征参数Cm(m=1~17)在20 组数据内归一化处理,求取各时域特征参数相互间的皮尔逊相关系数,即Cm与Cn(m,n=1~17,m ≠n)间的皮尔逊相关系数。

构建相关系数图时,如果相关系数阈值选得太小,就会有太多特征参数被选中,特征值筛选变得繁杂;如果相关系数阈值选得太大,则会有较少特征参数被选中,造成特征值丢失,这都可能导致后续故障识别环节效果变差。兼顾实验数据,通过选取相关性较大的特征参数并用线段将其两两连接构成一个相关性网图,即皮尔逊相关系数图。这样得到的相关系数图是一个无向图G(V,E),其中,V 表示节点的集合,每个节点表示1 个时域特征参数Cm(m=1~17),E 表示边的集合,每条边表示相连接的2 个时域特征参数相关性较大(≥阈值)。

2.1 阈值为0.9 的皮尔逊相关系数图

选取C1~C17中皮尔逊相关性≥0.9 的时域特征参数,按照上述方式构成相关性网图,如图1 所示。

图1 阈值为0.9 的皮尔逊相关系数图

结合图论知识,分析特征值去留组合,得到相互线性独立特征值。图1a)中若保留C2,则去掉C14,C15,同时,保留C12,得到C2,C12相互独立;若保留C14或C15,则其他3 个特征值均可去掉。用组合法列举出C2,C12,C14,C15去留组合方式,共3 种组合。图1b)中C6,C7,C8,C16两两间的相关性极好,可随意去掉其中的3 个,对这4 个特征值这里采用组合法列举出其去留组合方式,共4 种组合。采用组合法同时列举出两组特征参数C2,C12,C14,C15与C6,C7,C8,C16去留,C1~C17中各保留与去除的特征参数组合方式共12 种,如表1 所示。

表1 皮尔逊相关系数图特征值筛选(阈值为0.9)

2.2 阈值为0.87 的皮尔逊相关系数图

选取C1~C17中皮尔逊相关性≥0.87 的时域特征参数,按照前述方式构成相关性网图如图2 所示。

图2a)采用组合法列举出C2,C10,C12,C14,C15去留组合,共4种组合。图2b)中C3,C5,C6,C7,C8,C13,C16这几个特征值采用组合法列举出其去留组合方式,共6 种组合。采用组合法同时列举出两组特征参数C2,C10,C12,C14,C15与C3,C5,C6,C7,C8,C13,C16去留,C1~C17中各保留与去除的特征参数组合方式共24 种,如表2 所示。

图2 阈值为0.87 的皮尔逊相关系数图

表2 皮尔逊相关系数图特征值筛选(阈值为0.87)

2.3 故障识别及相关系数阈值的选择

GRNN[10]是基于非线性回归理论的4 层前馈型RBF神经网络,在模式分类问题中广泛应用。进行供油故障识别时,训练集和测试集数据分配为:供油正常40 组、37 组;漏油轻微40 组、22 组;漏油严重70 组、32 组;断油30 组、20 组。

利用缸盖顶部振动信号识别供油故障时,将17 个时域特征值全部用来构造故障特征向量集作为GRNN的输入,进行故障识别,结果如图3 所示。

利用阈值为0.9 和0.87 的皮尔逊相关系数图优化振动信号特征值选择,两种情况下分别结合表1,表2 选择相应的时域特征值组合构造故障特征向量集作为GRNN 的输入,故障识别结果如图4 所示。

图3 利用缸盖顶部振动信号识别供油故障

图4 不同相关系数阈值对故障识别结果的影响

图3 、图4 直观显示了三种情况下供油故障识别结果分布情况及分散程度。为了更精确地说明故障识别结果,将用具体的百分率表示的故障识别结果列于表3。下面结合图3,图4 和表3,对不同情况下的故障识别结果进行比较分析。

表3 故障识别结果的图、表对应情况

比较图3,图4 三种情况下的供油故障识别结果分布情况,在同时考虑对供油正常、漏油轻微、漏油严重、断油4 种工况的故障识别结果时,利用缸盖顶部振动信号识别供油故障和利用阈值为0.87 的皮尔逊相关系数图优化振动信号识别供油故障两种情况下的故障识别率从总体上来看差不多,但后一种情况下故障识别结果的分散程度相对较小。若与利用阈值为0.9 的皮尔逊相关系数图优化振动信号识别供油故障时相比,该种情况下的故障识别率要明显高于前两种情况,故障识别结果的分散程度也明显减小。于是在后续问题分析时,相关系数图中相关系数阈值选定为0.9。利用相同的相关系数阈值构建最大互信息系数相关系数图,对振动信号特征值进行筛选,同样,用相应时域特征值构造故障特征向量集作为GRNN 的输入,进行故障识别。对比皮尔逊相关系数图和最大互信息系数相关系数图分别优化振动信号特征值选择时所对应的故障识别率,选出识别率较高者,即为选定的利用相关系数图选择振动信号特征值的方法。

3 最大互信息系数相关系数图的构建

3.1 阈值为0.9 的最大互信息系数相关系数图

选取时域特征参数C1~C17中最大互信息系数相关性≥0.9 的特征参数,按照前述方式构成相关性网图如图5 所示。

图5 阈值为0.9 的最大互信息系数相关系数图

用与图1,图2 相同的分析方法,图5 采用组合法列举出特征参数C1~C17中各保留与去除的特征参数组合方式共18 种,如表4 所示。

3.2 最大互信息系数相关系数图应用在故障识别中

利用阈值为0.9 的最大互信息系数相关系数图优化振动信号特征值选择时,结合表4 选择相应的时域特征值组合构造故障特征向量集作为GRNN 的输入,故障识别结果如图6 所示。

比较图4a)、图6 两种情况下的供油故障识别结果分布情况,在同时考虑对供油正常、漏油轻微、漏油严重、断油这4 种工况的故障识别结果时,总体上看两种情况下故障识别结果差不多,具体来说后一种情况下对供油正常工况识别结果更好,分散程度也相对更小,其他3 种工况下的故障识别结果完全一样。图6 对应的4 种工况下的故障识别率具体数值分别为94.59%,86.36%,96.88%和100%,是上述方法中最高的。

表4 最大互信息系数相关系数图特征值筛选结果

图6 最大互信息系数相关系数图优化振动信号特征值选择

4 结 语

通过构建发动机振动信号的时域特征参数相关系数图,对振动信号特征值进行筛选,可以明显提高利用缸盖顶部振动信号识别发动机高压油路供油故障的识别率。相关系数图中相关系数阈值的选择对故障识别结果影响很大,通过实验比对选定相关系数阈值为0.9后,使用皮尔逊相关系数图和最大互信息系数相关系数图均可获得很好的故障识别效果,而且后者的故障识别效果更好。这种利用相关系数图筛选振动信号特征值的方法,可以推广应用到其他类型的振动信号、声音信号等信号处理场合。

注:本文通讯作者为赵红东。

猜你喜欢
皮尔逊互信息供油
现代统计学之父:卡尔·皮尔逊
现代统计学之父:卡尔·皮尔逊
Excel在水文学教学中的应用
卡方分布的探源
基于互信息的贝叶斯网络结构学习
联合互信息水下目标特征选择算法
改进的互信息最小化非线性盲源分离算法
基于增量式互信息的图像快速匹配方法
亚洲船供油市场
中国船供油市场