基于无监督深度学习的声发射信号聚类分析

2021-03-01 00:41闫小青

无损检测 2021年2期

李睿,张纯,万乐,闫小青

(南昌大学建筑工程学院, 南昌 330031)

声发射是指材料局部因能量的快速释放而发出瞬态弹性波的现象。声发射信号的检测、分类与分析有助于揭示结构内部损伤演化规律及破坏类型，在复合材料损伤检测、机械故障诊断等领域得到了广泛应用[1-2]。

特征参数分析和全波形分析是声发射信号处理的两种主要手段[3]。特征参数法是从各声发射信号的波形出发，人为设定并提取反映波形主要特征的参数用于信号诊断分析[4-5]。常见的特征参数有持续时间、上升时间、能量、幅值等。波形分析方法则是对声发射信号原始波形进行时频分析[6]，直接利用时频特征或结合主成分分析、支持向量机[7]等技术，研究声发射信号与损伤类型之间的关系。信号处理时，两种方法提取的信号特征都是人为预先设定的,但对于实际的结构或材料，其声发射信号复杂多样，受材料性能、结构形式、加载方式等多种因素影响；因此，人为预先设定的信号特征参数并不一定对材料损伤类型或模式敏感，不适当地选用特征反而会导致声发射信号的聚类分析效果不佳。

对于不同的声发射信号，信号特征的自适应提取以及聚类分析对解释AE(声发射)信号，进行模式识别意义重大。目前，以卷积神经网络(CNN)等为代表的深度学习技术是发展最为迅速的信号特征自动提取方法，其通过对图像、信号等数据的直接学习，能实现从具体到抽象等多个层次数据特征的自动提取[8]。在声发射信号的相关研究中，BARAT等[9]、ISLAM等[10]都利用CNN自动提取了声发射信号时频图的特征，来识别不同缺陷对应的声发射信号。NASIRI等[11]同样采用CNN提取原始声发射信号的特征，用于监测SiCf-SiCm复合材料管损伤过程的3个阶段。这些基于深度神经网络的声发射模式识别工作均属于有监督学习，即需要人为去设定用于训练的声发射信号标签(信号对应何种损伤类别或阶段)。人工逐一分析声发射数据并设定信号标签的工作量极大，在实际工程中是难以做到的。引入无监督学习方法，提出了使用深度自动编码器提取声发射信号特征，并结合K均值聚类进行声发射信号准确分类的方法。在无先验知识的情况下，2种不同类型声发射信号的分类识别试验验证了所提方法的有效性与可靠性。

1 基本原理与方法

1.1 基于一维卷积的深度自动编码器

深度自动编码器是一种无监督学习的非线性特征提取模型，可实现对无标签复杂高维输入数据不同层次分布特征的自动提取。其神经网络结构具有对称性，包括编码器和解码器2个部分(见图1)。编码器利用卷积、池化和激活等操作，对原始输入数据进行压缩降维；解码器则利用反卷积、反池化等操作，对降维后的特征进行原始数据重建，并利用反向传播算法来训练网络,使得网络输出尽量逼近网络输入。因此，深度自动编码器在学习过程中无需人为设定样本标签。学习完成后，最少神经元层的编码结果即可代表原数据最佳的低维特征值，可进一步用于信号聚类分析。

图1 卷积自编码器结构示意

对于声发射波形信号，文章采用了一维卷积层[12]对原始信号进行直接处理，而未利用时频变换将原始信号转变为二维图像处理，减少了信号处理的工作量。输入的声发射信号在经过多个一维卷积和池化处理后,会得到多个通道的中间层(最少神经元层)数据；将中间层每一个通道的数据通过平均池化(取均值)压缩为一个实数，这个实数在某种程度上具有全局的感受野；再按照通道顺序将这些实数进行组合即可得到信号的通道维度特征。

1.2 深度卷积自编码器结合K均值聚类的声发射信号分类识别算法

在解决声发射信号模式识别的问题时，选取信号特征参数进行聚类分析是一种常见的做法[13-14]。由于声发射信号特征参数类型和个数的选择将直接影响聚类结果的好坏，所以为避免人为特征选择的困难，文章基于深度卷积自编码器自动提取的信号通道维度特征，结合K均值聚类算法对声发射信号进行聚类分析。

K均值聚类算法使用欧式距离衡量数据点的相似度，通过反复迭代，每个数据点和距离其最近的类簇之间的距离平方最小[15]。利用K均值聚类算法处理自编码器自动提取的特征，并完成声发射信号聚类分析的流程如图2所示。

图2 声发射信号识别流程图

2 声发射试验验证

2.1 试验装置和过程

试验采用的声发射检测仪器为PCI-2型声发射仪，选用了2个中心频率为150 kHz的R15型谐振式传感器。将2个传感器分别用黑色胶带固定在玻璃纤维复合材料板试件两端，并在探头与试件的接触部位涂凡士林耦合剂，以防止声发射信号在传感器和试件界面处过度散射和衰减。处理系统选用AEwin软件，前置放大增益为40 dB、信号门槛值为30 dB、系统采样频率为1 MHz。用直径为0.5 mm的铅芯在玻璃纤维复合材料板上摩擦和突然断裂生成2类声发射信号，用于模拟不同损伤模式下的声发射现象。为方便结果验证，在整个试验过程中，始终保持铅芯与试件的摩擦，并随机、间断地进行100次断铅试验。

2.2 试验数据

整个试验过程中共记录了3 860个声发射信号，其中包含断铅信号200个(2个传感器均会接收到断铅信号)、摩擦信号3 660个；但具体声发射信号类别未知。部分声发射信号波形如图3所示(信号类别均由后期的人工分析得到)，每个声发射信号波形均包括1 024个采样点。

2.3 网络训练

深度卷积自编码器模型的网络结构参数如表1所示(表中各参数均无量纲)。该模型编码器部分共有6层卷积层与池化层，解码器部分与其对等。在编码器部分，各层卷积核大小均设为3。模型的输入和输出均直接采用原始声发射信号(3 860个波形数据)，损失函数采用均方误差，激活函数为ReLU(修正线性单元)，初始学习率设置为0.001，共进行5 000批次的迭代训练，训练时保存最优模型作为最终的深度自编码器。

3 计算结果与分析

3.1 无监督学习聚类结果分析

图4 卷积自编码器可视化聚类结果在时间上的分布

将所有声发射信号输入一维卷积深度自编码器训练后，再利用自编码器自动提取的信号特征进行聚类的结果如图4所示(图中特征1，特征2数值均为自编码器输出值，无量纲)。文章提出的声发射信号聚类分析算法将所有声发射信号划分为2类，其中类别1包含3 660个声发射信号，类别2包含200个声发射信号。进一步观察类别2中信号的波形特征以及2个传感器中信号出现的时间(断铅信号会被2个传感器接收到)，可以获知类别2即为断铅信号集。聚类结果的轮廓系数在0.85以上，可视化图像也显示出了2类信号被清晰地分割，表明文章提出的方法能在无先验知识的情况下，通过无监督学习，准确实现了声发射信号的类型识别。

分类后的声发射信号传统特征参数值在试验时间上的分布如图5所示。在常见的特征参数中，类别2的声发射信号(断铅信号)具有较低的上升时间、持续时间和计数，但和类别1(摩擦信号)的信号有重叠；区分度最大的特征参数是能量与幅值，而峰频则无法用于区分不同信号的类别。

图5 聚类结果的传统声发射特征参数在时间上的分布

3.2 不同聚类识别方法对比

进一步比较基于传统特征参数的聚类方法和提出的方法在信号分类上的性能。试验测得的声发射信号部分特征参数如表2所示。由于可以采用不同的特征参数组合作为聚类变量，所以根据已有研究[16-18]分别选取表3中(PA为幅值，D为持续时间，RT为上升时间，E为能量，C为振铃计数，PF为峰值频率)的3种特征参数组合，同时考虑3.1节的计算结果，补充选取区分度最高的两个特征参数(能量和幅值)作为聚类特征组合。传统声发射信号特征参数在量纲上存在很大的差异，因此在聚类分析前利用平均数方差标准化消除量纲对分类结果的影响，相应的计算公式为

(1)

表2 声发射信号特征参数

表3 声发射信号特征参数聚类结果

将聚类特征参数标准化处理后，再统一使用K均值算法对试验信号进行类别判断，识别结果如表4所示。为方便比较，图6给出了不同特征参数组合的聚类结果在能量与幅值上的分布关系。

图6 不同特征参数组合的聚类结果在能量与幅值上的分布关系

表4 不同自编码器聚类结果

聚类结果表明，不同特征参数的组合会不同的聚类效果。组合4中，特征参数幅值和能量是经过人工分析选择出的最具区分度的聚类指标；因此，仅用两个指标聚类就能达到很高的分类准确率(只出现1例断铅信号误判)。组合1在组合4的基础上增加了振铃计数和持续时间2个特征参数，但分类效果反而降低了，断铅信号出现了26例误判。组合2选择的5个特征参数能完全正确地进行声发射信号分类；组合3在组合2的基础上仅增加了振铃计数，但分类准确率显著降低。从由图6(c)可知，基于组合3特征参数的聚类算法将断铅信号中的一个子集识别为一类，而将其他断铅信号与摩擦信号混为另一类。由此可见，不是所有的特征参数都利于信号聚类，不合适的特征参数类型与个数选择反而会降低声发射信号的聚类分析效果；所以，基于特征参数的信号聚类与识别方法仍然需要大量的人为分析和计算验证。

与基于人工选择特征参数的聚类算法相比，表3和图6(e)所示结果都表明，文章所提算法无需考虑特征参数类型和数目的选择，依赖于深度自编码器的自动特征提取功能，可实现声发射信号自动化的准确聚类。

3.3 不同卷积核尺寸对声发射信号识别的影响

在处理声发射信号的一维卷积神经网络中，卷积核的大小是一个很重要的网络结构参数。自编码器特征提取层的每一个元素所对应的输入数据时间段(即感受野)大小是由卷积核的尺寸和网络层数决定的。卷积核大小会直接影响深度自编码器对声发射信号特征的提取。卷积核尺寸越大，提取特征对应的原始声发射信号时间段也就越长，其效果相当于忽略更多的细节、提取更抽象的信号特征。

为了进一步研究深度卷积自编码器结构对声发射信号识别的影响，保持表1所示的深度自编码器网络基本结构不变，设置了5种自编码器，其第一层卷积核的大小分别为64，32，16，8，3，解码器的最后一个反卷积层也相应改变。声发射信号聚类分析的结果如表4所示。当深度自编码器第一层卷积核尺寸逐步减小时，信号类别诊断的准确率以及类别的可分性(轮廓系数)整体上呈现不断提高的趋势；而且当第一层卷积核小于16后，信号类别检测的准确性就能达到接近完全正确的程度。第一层卷积核的大小会直接改变中间层数据的感受野大小。第一层卷积核为64时，中间层每个数据对应的感受野大小为524，即相当于原波形信号中524个时间点的数据被压缩到一个值。显然，使用小的第一层卷积核可以保留更多的信号细节特征。计算表明，使用较小的第一层卷积核对声发射信号的分类是有利的。

4 结论

(1) 在众多人为设定的声发射信号特征参数中，不是所有特征参数都有利于信号的模式识别与类别检测。在该试验中，仅能量和幅值对断铅、摩擦声源具有较高的检测灵敏度。因此，需要人工对声发射信号特征进行分析，选取合适的特征类型与个数。

(2) 利用无监督的深度学习方法能够很好地克服参数分析、波形分析中存在的特征有效性不足以及需要人工干预的问题。利用自编码器进行声发射信号特征自动提取，再结合K均值算法能够有效地区别不同声源的声发射信号，特别是在声发射信号事件较多且无法获得标签的时候具有明显的优势。

(3) 深度自编码器具备很强的特征学习能力，可从原始声发射波形信号中自适应提取有效特征用于聚类分析；而且使用较小的第一层卷积核尺寸，可以保留更多信号的细节特征，有利于声发射信号的识别与分类。