基于Fast-DTW 的空间域等间隔采样序列的相似性研究

2021-04-12 08:24郑祥爱刘文波蔡超徐梦莹王平姚楠
铁道建筑 2021年3期
关键词:规整轨距曲率

郑祥爱 刘文波 蔡超 徐梦莹 王平 姚楠

(1.南京航空航天大学自动化学院,南京 211100;2.高速载运设施的无损检测监控技术工业和信息化部重点实验室,南京 211100;3.中国铁道科学研究院集团有限公司基础设施检测研究所,北京 100081)

工程检测中,有些检测信号是以距离为自变量的函数而非以时间为自变量,只有在空间域中才能真实地反映被检对象的特性与状态,称为空间域信号[1]。对空间域信号进行等间隔采样得到空间域等间隔采样序列。在高速铁路的轨道质量状态检测中,实际轨道分布于空间域,高速综合检测列车在检测过程中非匀速行驶,等时间间隔采样会导致轨道状态采样疏密不同[2],极易造成漏检,留下安全隐患。因此,轨道检测系统采用等间距采样。

轨道质量状态常用轨道几何不平顺参数表征[3],常见的轨道几何不平顺参数有高低、水平、三角坑、轨距、轨向等。各检测参数的测量原理可大致分为两类:激光摄像式和惯性测量式。其中,轨距、轨向由激光摄像式测量原理得到。激光摄像过程容易受到外界不利因素的干扰,例如单侧剧烈阳光干扰或钢轨打磨后过亮导致摄像机无法定位轨距点,均会影响成像过程。激光摄像装置对获得的钢轨图像进行一系列图像处理后得到单边轨距,传输到计算机中进行轨距的合成计算[4]。单边轨距分为单边轨距左(Gauge Left)和单边轨距右(Gauge Right),分别用GL和GR表示。GL和GR是决定轨距的关键参数,也是研究的主要参数。

轨道检测系统发生干扰性故障会导致单边轨距获得值无效,势必影响轨距的有效测量而不能正确反映轨道实际质量状态,从而造成安全隐患。针对这一问题,本文首先选定参考性序列,研究其与单边轨距之间的相似性,考察该相似性作为故障特征的代表性,以避免故障干扰。

1 物理意义

在采用激光摄像组件进行轨距的测量与合成时,以固定的轨道长度距离为采样间隔获得了GL和GR的序列值。激光摄像组件集成在高速综合检测列车的轨道检测系统中,该检测系统同时测量并合成了其他轨道几何不平顺的参数,如曲率、轨向,均为空间域等间隔采样序列。

曲率的测量主要是通过惯性传感器陀螺仪、位移计和光电编码器,不受激光摄像组件间的影响。曲率与GL,GR是相互独立的关系。轨向的测量包括两部分:一部分是安装于轨距检测梁中央位置的伺服加速度计,即轨向加速度计ALGN,用于测量轨向加速度;另一部分为左右轨距测量装置,用于测量GL和GR[4]。轨向检测原理如图1所示。图中,x轴为惯性基准;y轴为轨距梁中心位置的横向惯性位移;D为两轨标准间距,一般为1500 mm;YL为左轨向;YR为右轨向;M,N为两轨标准间距中心线上的两点。

图1 轨向检测示意

由图1 可知,轨距检测梁中央位置的横向惯性位移y(x)的大小与曲率存在相关性。当综合检测列车经过铁路弯道(即曲率较大)时,假设列车向左拐弯,轨距检测梁会由于惯性而整体右移;反之,轨距检测梁会整体左移。当综合检测列车从M点移动到N点,有y(x1)>y(x2),则GL由大变小,GR由小变大。因此,GL,GR的变化趋势与曲率的变化趋势类似。根据这一规律,把曲率的测量值作为参考性序列,提取出二者的相似性作为故障特征,可运用到检测传感器故障的判别中。

2 算法描述

2.1 S-G滤波器平滑数据流

Savizkg-Golag 滤波器(简称S-G 滤波器)最初由Savizkg 和Golag 于1964年提出,后被广泛应用于数据流平滑去噪,是一种基于最小二乘原理的多项式平滑算法。S-G 滤波器的核心思想是用一定长度窗口内多个带有不同权重的点来表示其中的一个点,实际上是一种移动窗口的加权平均算法,其加权系数通过在滑动窗口内对给定高阶多项式进行最小二乘拟合得到[5]。该算法的基本思想为:

设g(n)中的一组数据为g(i),i=-M,…,0,…,M,可以用p阶多项式fz来拟合g(i),即

式 中:k为 多 项 式fz的 阶 次;ak为 第k阶 多 项 式zk的系数。

拟合误差ε的表达式为

为使平滑前后的数据变化趋势尽可能不受影响,希望拟合误差足够小,则令ε对各系数的导数为零,由此得到

由式(3)可知,只需给定滑动窗口长度M(M为奇数)、多项式阶次p以及待拟合的数据g(i),即可确定多项式fz中的各加权系数[6]。

可见,这种数据平滑方式能够减少对有用信息的影响,保留原始数据的变化形状与趋势,且只需要确定两个参数(滑动窗口长度和多项式拟合阶数)。本文将曲率作为参考性序列,计算曲率与平滑处理后的新序列值的线性相关度,根据最佳线性相关度确定滑动窗口长度和多项式拟合阶数。

2.2 快速动态时间规整算法

传统的动态时间规整算法(Dynamic Time Warping,DTW)常用在时间序列的处理中,比如孤立词的语音识别(识别两段语音是否表示同一个单词),是一种时间序列对齐方法,能够衡量两个非等长时间序列的相似度[7]。DTW 算法通过规整路径距离矩阵动态规划寻找到最小规整路径距离,以衡量两个时间序列的相似性。假设有原始时间序列X(序列长度为X)和Y(序列长度为Y),则规整路径距离的表达式为

式中:D(i,j)为X序列中前i个点与Y序列中前j个点的相似性;d(i,j)为X序列中第i点与Y序列中第j点之间的欧式距离。

最终的规整路径距离是D(|X|,|Y|)[8],其值越小,两个原始时间序列的相似性越大。

算法每次执行都会从序列的第一个元素搜索到最后一个元素,时间复杂度为O(n2),数据量较大时算法的实时性较差。采用快速动态时间规整(Fast Dynamic Time Warping,Fast-DTW),时间复杂度降低为O(n)。Fast-DTW 综合使用限制搜索空间和数据抽象两种方法来加速DTW 的计算,算法图解如图2 所示[9],主要步骤为[8]:

1)粗粒度化。原始数据抽象处理,用多个细粒度数据点的平均值作为粗粒度数据点,从而缩短数据序列长度。同时将搜索空间限制在阴影部分,从而达到减少搜索次数的目的。

2)投影。运用DTW 方法求粗粒度化数据序列的规整距离和规整路径。

图2 Fast-DTW 算法

3)细粒度化。将在粗粒度上得到的规整路径还原到细粒度的数据序列上,最终得到两个时间序列的相似距离与规整路径。

3 试验结果分析

试验数据来源为轨道检测系统对轨道质量状态进行检测监测的测量数据,主要是激光摄像装置对钢轨图像进行处理后获取的GL,GR,以及惯性传感器陀螺仪与位移计测量合成的曲率。三者都为空间域等间隔采样得到的数据序列,采样间隔为0.25 m。

针对数量庞大的检测数据,为提高数据处理的速度以及实现较好的相似性度量,采用大滑窗与小滑窗相结合的方法。数据预处理中首先采用大滑窗实现数据的切分,窗长为2 km(8000 点序列值)。利用S-G滤波器平滑数据流时滑动窗口M和多项式阶次p的确定结果,分别表示在不同的滑动窗口M与多项式阶次p下GL与曲率的线性相关度、GR与曲率的线性相关度,如图3所示。

图3 不同M与p下单边轨距与曲率的线性相关度

根据最佳线性相关度,确定S-G 滤波器的滑动窗口长度M的取值为401 ~601,多项式拟合阶次p的取值为2 或3。为保证较高的拟合度,取M=501,p=3。为了消除不同参数之间的幅值差异,且不改变各参数本身的正负符号特性,对数据进行归一化处理,将等间距采样得到的各序列值缩放至[-1,1]。归一化处理后,单边轨距与曲率的平滑数据流随里程的变化曲线见图4。

图4 单边轨距与曲率的平滑数据流变化趋势对比

由图4可知:

1)平滑后的GL与曲率的变化趋势高度相似;若将平滑后的GL序列值取为相反数,其变化趋势也与曲率具备高度的相似性。

2)GL和GR的数据变化特性受曲率的影响,在铁路轨道非平直或存在拐弯的里程段,GL和GR呈现出一定的波动性,且与曲率的波动性相似或相反。

综合检测列车改变行车方向时,则曲率的变化趋势与GR相似,与GL相反。当GL或GR的变化趋势与曲率相反时,对其取相反数操作后同样可以获得相似性度量。

特别地,由于曲率为零向量时无法参与相似性计算,故须对其进行转化处理,人为赋值但不改变其直线段特性。按照轨道特性将轨道单元分为直线段与曲线段分别进行处理。本文中轨道处理单元为2 km,曲率全为零的里程段为直线段,否则为曲线段。具体实现流程如图5 所示。其中,CL为GL与曲率的线性相关度,CR为GR与曲率的线性相关度,DL为GL与曲率的动态时间规整距离,DR为GR与曲率的动态时间规整距离。

图5 单边轨距与曲率的相似性度量流程

按上述流程,分别得到不同类型的样本数据下单边轨距与曲率的快速动态时间规整距离,结果见表1。

表1 单边轨距与曲率的快速动态时间规整距离

由表1可知:

1)单边轨距与曲率的快速动态时间规整距离应在300 ~800。

2)受轨道特性的影响,曲线段轨道中单边轨距与曲率表现出较好的相似性,直线段轨道中单边轨距平稳波动在某一稳定值附近,与曲率的相似性稍差,如样本3 中单边轨距与曲率的快速动态时间规整距离较大。

3)故障样本中多表现为单侧干扰,例如剧烈阳光干扰,此时单边轨距与曲率的快速动态时间规整距离大于等于1000;样本9 和样本11 表现为双侧干扰,多考虑为受钢轨打磨干扰,打磨后的钢轨面过亮导致摄像机无法定位轨距点,此时单边轨距与曲率便失去了相似性。

综上,以该相似性程度为故障特征,作为机器学习分类模型的输入,可为轨道检测系统的干扰性故障判别奠定良好的数据基础。

4 结语

本文将快速动态时间规整(Fast-DTW)方法引入到空间域等间隔采样序列(轨道质量状态检测数据)的相似性研究中,并结合S-G 滤波器平滑数据流对采样序列进行预处理,根据最佳线性相关度选取了滑动窗口长度M和多项式拟合阶次p,得到了单边轨距与曲率的快速动态时间规整距离。健康数据与故障数据中单边轨距与曲率的快速动态时间规整距离展现出了较好的区分性。因此,可将该相似性度量指标作为特征运用到故障识别中。但这只能作为检测传感器故障判别中的特征之一,要想提高识别精度,还需要其他融合性特征。下一步研究中将考虑提取其他特征与该相似性结合的度量方法,并运用到检测故障判别中。

猜你喜欢
规整轨距曲率
“教学做合一”在生成课程背景下构建区角游戏开展
一类具有消失χ 曲率的(α,β)-度量∗
儿童青少年散瞳前后眼压及角膜曲率的变化
面向复杂曲率变化的智能车路径跟踪控制
亚欧大陆跨境铁路的轨距问题
轨距对轨道结构受力特性的影响
UIC电子新闻12月10日刊
300kt/a硫酸系统规整填料使用情况简介
角度补偿轨距尺的研究与开发
不同曲率牛顿环条纹干涉级次的选取