非平稳信号度量方法综述

2017-09-07 09:50周文颖殷福亮
数据采集与处理 2017年4期
关键词:平稳性度量语音

陈 喆 王 荣 周文颖 殷 殷 殷福亮

(大连理工大学信息与通信工程学院,大连,116024)

非平稳信号度量方法综述

陈 喆 王 荣 周文颖 殷 殷 殷福亮

(大连理工大学信息与通信工程学院,大连,116024)

非平稳性度量是非平稳信号处理中的重要课题。尽管已有的度量方法在原理上有较大差异,缺少统一的理论框架和度量标准,但这些非平稳信号度量方法都在其相应领域发挥了重要作用。本文对随机信号非平稳度量方法进行了综述,系统地总结、归纳了不同领域现有的随机信号非平稳性度量方法,包括基于统计量和动力学参数的时域方法、时频域参数方法、信号建模参数方法以及特定类别信号的非平稳性度量方法,给出了各种度量方法的应用,并展望了非平稳性度量的未来发展方向。

非平稳信号;非平稳性度量;时频表示;非线性;周期平稳

引 言

随机信号主要分为平稳随机信号和非平稳随机信号。平稳随机信号是指对时间的变化具有某种平稳性质的一类信号。平稳随机信号(过程)的定义[1]主要有联合概率密度定义的严平稳,也称为狭义平稳,以及用一阶和二阶统计量定义的宽平稳,也称为广义平稳。目前,平稳随机信号分析与处理方法日趋成熟,已形成了较完善的理论体系,并在实际中得到了广泛应用。

除了平稳随机信号外,在自然界和社会经济领域许多现象需要用非平稳随机过程来描述。例如,不具备各态历经性的爆炸信号、回转机械产生的振动信号、生物医学中的肌电信号和受多种社会因素制约的股票价格数据等。目前,非平稳随机信号还没有严格、明确的“非平稳”定义,只是简单地将除了平稳随机信号(过程)以外的其他随机信号(过程)统称为非平稳随机信号(过程)。长期以来,对于非平稳信号的研究大都是根据信号特征或应用数学方法,先将非平稳过程转化为(如差分处理等)或近似为(如分段平稳处理等)平稳过程[2],然后将成熟的平稳随机信号处理理论和方法用于非平稳随机信号处理。在有些应用场合,这种转化或近似方法取得了很好的处理效果,并在语音处理等领域得到广泛应用,但在多数情况下,这种处理方法效果较差,甚至不能使用,特别是研究有些实际信号的非平稳特性时,舍弃的非平稳信号部分往往蕴含着信号某些重要特征,这就使信号分析处理工作本身失去意义。多年来,非平稳随机信号分析与处理方法研究得到了广泛关注,并取得了一定进展,一些新理论与新方法不断涌现,其应用领域日益扩大,并在语音处理、图像处理、通信网络、雷达、声纳、生物医学、遥感遥测、地震勘探、机械工程、水文海洋以及社会经济分析等领域得到了广泛应用。

在实际应用中,为了对非平稳随机信号有效处理与分析,常需要对信号的非平稳性进行度量。随机信号的非平稳程度不仅体现了信号本身的特性,也间接反映了产生信号的系统特性,因此,对信号的非平稳性进行有效度量,可以掌握随机信号的基本特性,以便采用相应的方法进行分析处理并对其加以利用。近些年来,一些学者在不同领域用不同方法和参数对随机信号的非平稳度进行了广泛研究,针对不同应用场景,从不同角度提出了一些有效的度量方法,这些研究成果主要考查随机信号的统计特性、非线性特性和时频域内的特性。例如,计量经济学中常用单位根方法来测量时间序列的非平稳性[3,4];根据分位数自回归模型预测的临界分位数值来判别通货膨胀率变化的非平稳点[5];应用非线性交叉预测分析[6]或回复性[7]来检测数据流的非平稳性;通过随机信号的时频域能量谱来衡量其非平稳度[8]等。目前,有关随机信号的非平稳度量方法的研究取得了一定进展,但有关成果大都分散在不同专业领域,不利于人们系统地理解掌握并加以利用。

本文对不同领域现有的随机信号非平稳度量方法进行了系统综述,对基于统计量和动力学参数的时域方法、时频域参数方法、信号建模参数方法以及特定类别信号的非平稳性度量方法进行了梳理和归纳总结,对其应用进行了相应说明,并对随机信号非平稳性度量方法的发展趋势进行了展望,以期对非平稳随机信号处理与分析相关研究提供参考和借鉴。

1 随机信号非平稳性时域度量方法

1.1 基于随机信号(过程)统计量的非平稳性度量

基于概率密度的平稳度度量方法主要包括:基于对数似然比、基于贝叶斯信息准则(Bayesian information criterion,BIC)和基于Kullback-Leibler散度三大类[9]。在工程上,随机信号(过程)的概率密度估计困难,因而统计量(包括矩、特征函数和高阶谱等)就成为描述随机信号(过程)的主要参数。这些统计量可以有效地描述平稳随机信号(过程),适当修改后也可以描述非平稳随机信号(过程)。其中较常用的参数有:短时能量、短时过零率、自相关函数、高阶累积量和高阶谱等。

1.1.1 短时能量与短时过零率

设时间序列x(n),加长度为N的窗函数w(n)后,序列为sw(n)=x(m)w(n-m),n=0,…,N-1,则sw(n)的短时能量E定义为[10]

(1)

短时过零率Z定义为信号波形穿过横轴(零电平)的次数,即

(2)

式中sgn(·)为符号函数。

作为在时域中描述信号非平稳性的参数,短时能量可看作是二阶原点矩的估计,短时过零率可看作是信号主要频率成分的估计。短时能量和短时过零率可用于具有短时平稳性的非平稳信号的特征检测。语音为典型的具有短时平稳性的非平稳信号,利用短时能量与短时过零率,可确定语音的起止位置,进行语音活动检测[11]等。

1.1.2 相关函数

时间序列x(n)的自相关函数rx(m)定义为[12]

(3)

式中m为时间位移量。

零均值平稳时间序列的自相关函数通常是截尾或拖尾的。如果其自相关函数既不截尾,也不拖尾(ARMA序列除外),则可判定该序列是非平稳信号[13]。自相关函数常用于语音处理中基音周期的估计[14]和模型预测等[15]。

1.1.3 高阶累积量和高阶谱

阶数大于2的累积量称为高阶累积量,其傅里叶变换称为高阶谱(或多谱)。高阶累积量是描述随机过程高阶统计特性的一种数学工具,可用于随机信号分析[16]。

若信号x(n)为零均值的k阶平稳随机过程,其K阶累积量定义为[17]

(4)

式中τ为时延。高阶累积量可用矩来表示,常用的三、四阶累积量分别为

(5)

(6)

K阶谱定义为K阶累积量的K-1维离散傅里叶变换,即

(7)

高斯过程的三阶及三阶以上的累积量均为零,非高斯过程则不全为零,据此,可用高阶累积量从高斯背景噪声中提取非高斯信号。一般认为,高斯信号由一阶和二阶统计量就可确定其统计性质,它是广义平稳的,因此高阶累积量可作为度量信号非平稳性的一种方法。高阶累积量可应用于语音处理[18]、生物医学信号处理[19]、地震信号分析[20]、图像处理[21]以及振动分析[22]等领域。

1.2 基于非线性动力学的非平稳性度量

1.2.1 分形维数

Mandelbrot在1975年首次明确提出“fractal”一词,该词来源于拉丁词语“fractus”,表示“不规则的、琐碎的、分数的”意思[23]。若一个形体的组成部分以某种方式与整体相似,则称为分形。分形具有自相似性和标度不变性。从数学的观点看,分形是Hausdorff维数严格大于拓扑维数的集合。分形维数包括关联维数、容量维数、信息维数和计盒维数等。

混沌系统通常为某种形式的非线性系统,系统输出为类似随机信号的混沌信号,系统初始态的任何微小变化都会导致系统行为随时间增长呈指数性发散,但其始终在状态空间中的有限区域内,即奇异吸引子内。存在奇异吸引子是混沌系统的显著特征,而关联维数是描述奇异吸引子的有效工具,它是奇异吸引子自相似特性和尺度不变特性的不变测度。关联维数反映了序列中各点之间的相关程度,使用关联维数能从输出变量的时间序列中有效地提取出系统的动力学特性[24]。

关联维数的计算过程如下。

(a) 对时间序列x(n),构造如下向量

(8)

式中:L为时延跨度,即x(n)中相邻元素间的间隔采样点数;p为x(n)初始位置;J是相邻x(p)的第一个元素之间的间隔采样点数,通常取J=1,以保证能利用所有数据信息。

(b) 设p的取值范围为[0,NM],r为正实数,相关积分C(M,r)定义为

(9)

式中:dist(·)是某种向量范数;U(·)为单位阶跃函数

(10)

相关积分C(M,r)表示参考点周围半径为r的M维空间所包含矢量的概率。

(c) 曲线lnC(M,r)~lnr的斜率定义为D2(M,r),即

(11)

(d) 关联维数为

(12)

假设时间序列x(n)是由q个状态变量描述的动力学系统产生的,根据Takens理论[25],其轨迹位于系统相空间中一个d维(d

在噪声情况下,分形维数会受到影响,此时可通过预处理算法来降低噪声影响。对于非平稳信号,关联维数等分形维数也是有效的分析工具,例如在语音处理中,可用关联维数来进行语音端点检测[26,27]。目前分形理论已广泛用于地质勘探[28]、故障诊断[29]和图像处理[30]等领域中。

1.2.2 近似熵

Pincus在1991年从度量时间序列复杂性的角度,提出了近似熵(Appropriate entropy,ApEn)[31]。近似熵定义为相似向量在由m维增加至m+1维时继续保持其相似性的条件概率,它是从统计角度来描述时间过程的复杂性。近似熵ApEn的定义与混沌信号关联维数有密切的关系。

对于长度为N的时间序列x(n),定义向量X(n)=[x(n),x(n-1),…,x(n-(M-1))]T,0

(13)

给定正实数r,Ci(M,r)定义为与向量X(i)的无穷范数不大于r的向量个数与向量总数的比,即

(14)

式中U(·)为单位阶跃函数。Ci(M,r)的对数平均值为

(15)

近似熵ApEn(M,r)定义为

(16)

对于时间序列x(n),其近似熵可用ApEn(M,r,N)=φM(r)-φM+1(r)来近似估计。近似熵与信号的规则程度有关,非平稳信号通常都不规则,所以当维数变化时,时间序列的平稳性就会变差,此时产生新模式的概率增大,相应的近似熵也增大,据此,近似熵可作为信号非平稳度的一种度量。文献[32]用经验模态分解(Empirical mode decomposition,EMD)将信号分解为单模式分量(Intrinsic mode function,IMF),进而对每个单模式分量用近似熵衡量其非平稳程度。

由于近似熵所需数据点数少,具有较好的抗噪和抗干扰能力,现已用于生物电信号处理[32]、机械设备故障检测[33]、语音信号端点检测和气候突变检测[34]中。

1.2.3 Hurst指数

水文学家Hurst在研究重标定极差分析法(Rescaled range analysis,R/S)[35]时,提出了非参数统计量——Hurst指数,简称H指数。R/S分析方法以分数布朗运动理论为基础,通过计算Hurst指数H来分析时间序列的特征。

基于Hurst指数对时间序列长期相关性分析的原理,结合分数布朗运动理论和R/S分析方法,可从整体上识别与检验时间序列的变异程度。首先用R/S分析方法,计算序列的Hurst指数,计算其相关函数值;然后在给定显著性水平下,根据相关函数是否通过假设检验以及相关函数的大小,将变异程度划分为不同变异等级,并将Hurst值对应地划分为相应的区间。实际应用时,只需根据实测的时间序列,计算Hurst系数值及其所属的变异等级区间,就可以检验序列的变异程度[36],以此度量非平稳时间序列。

用R/S分析法计算Hurst指数的具体步骤如下[37]。

(a) 将长度为N的时间序列分成[N/M]个长度为M的相邻子序列。对子序列计算样本均值,即

(17)

式中u=1,2,…,[N/M]。

(b) 对子序列,取离差为

(18)

计算累积离差为

(19)

(c)计算子序列的极差

Ru=maxzu-minzu

(20)

计算标准差

(21)

(d) 计算各区间的重标极差Ru/Su,[N/M]个区间得到[M/N]个Ru/Su值,取平均值RN/SN作为区间长度为M的重标极差值。对Hurst经验公式

(22)

两端取对数得到

lg(RN/SN)=HlgN+lgb

(23)

式中b为常数,H为Hurst指数。

(e) 对不同区间长度M,重复步骤(a)至(d),得到不同RN/SN值,以lgM为自变量,lg(RM/SM)为因变量作双对数坐标散点图,用最小二乘法拟合直线,其斜率H值即为时间序列的Hurst指数。

通过Hurst指数,可以定量表征时间序列的持续性或长期相关性。Hurst指数H的意义为:当H=0.5时,表示该序列是随机的,未来的变化趋势与当前无关;当H>0.5时,表示序列具有正持续性,未来的变化趋势与现在具有相同的变化趋势;H<0.5时,表示序列具有反持续性,未来的变化趋势具有与现在相反的变化趋势。H越接近于1,表示序列正持续性越强;H越接近于0,表示序列反持续性越强。因此,可根据Hurst指数的取值判断序列的非平稳程度。Hurst指数已在水文、地球化学、气候、地质以及地震等领域得到应用。

1.2.4 时间序列异常特征值

将网格的思想引入到最小化边界矩形(Minimum bounding rectangle,MBR)表示中,称为时间序列网格最小化边界矩形(Grid minimum bounding rectangle,GMBR)[38],MBR是一种时间序列表示方法,GMBR是将MBR离散化后转换到一个网格空间中。文献[38]将基于距离与密度的时间序列检测方法相结合,给出了时间序列模式异常的描述,即用异常特征值衡量时间序列的异常程度,以此度量数据的非平稳性。

首先将时间序列用GMBR表示,对每个MBR进行符号化,并将其转化成二进制符号串;然后将每个MBR离散化,每个MBR数据均看成一个小的时间序列S,将其转换到网格空间中。

时间序列T=t1,t2,…,tn为有序项队列,其中n为整数。对于长度为n的时间序列T,其长度为m(m≤n)的子序列S可以表示为S=tp,tp+1,…,tp+m-1,其中p为子序列S的起始点,且1

(24)

式中网格宽度Wg为常数。

异常特征值的具体计算如下[38]:

(1) 给定正整数k和数据集O,数据集中的查询序列为q,∀p∈O,p的k距离定义为对象p和对象q之间的距离LBD(p,q),若满足:(a)至少有k个对象m∈O,使得LBD(p,m)≤LBD(p,q);(b)至多有(k-1)个对象m∈O,使得LBD(p,m)≤LBD(p,q),则称LBD(p,q)是p的k距离,记为d(k)。

(2) 给定正整数k和数据集O,∀p∈O,若存在q∈O,满足

(25)

则q为p的一个k可达邻域数,记为N(p)。

一个对象的k可达邻域数越大,表明该模式的密度越大;反之,则表明该模式的密度越小。

(3)p的密度MD(p)定义为

(26)

(4)W是T的子序列,GMBRw是子序列W的GMBR表示,GMBRwl是与子序列W最近的GMBR,对于T中任意一个子序列Y,GMBRyl为与子序列Y最近的GMBR,密度阈值为μ,若W满足

LBD(W,GMBRwl)>LBD(Y,GMBRyl)且MD(GMBRw)<μ

(27)

则W为异常特征序列。

使用距离和模式异常来共同检测异常子序列,在距离均大于给定阈值基础上,比较时间序列的异常特征值。异常特征值由模式的密度决定,模式的密度越大,表示与该模型相似的模式越多,该模式为异常的可能性越小;反之,模式密度越小,该模式为异常的可能性越大。

这种方法将距离和密度相结合来检测时间序列的异常变化,以此度量数据的非平稳性,可用于欺诈甄别、网络入侵检测以及监控等领域[38]。

1.3 数据流非平稳性度量

实际中,视频监控数据、网络点击数据和声音监控数据等具有动态、时变的特点,这种按顺序不断产生的数据流[39]都是动态变化的信号,具有非平稳特性。文献[40]应用信息论、粗粒化方法等,研究了数据流的非平稳性度量问题,并借助频率序列的稳定性引入了稳定集合的概念,用稳定集合的多少衡量数据流的非平稳程度,给出了数据流的非平稳性度量。

数据流X的非平稳性度量公式为

(28)

式中A为数据流X按照稳定标准C所划分的有限空间,将A划分为m个子区间,即A={A1,A2,…,Am};H(A)为A的熵,HA,C(X)为数据流X的熵。非平稳度量NSA,C(X)介于0到1之间,NSA,C(X)越小,数据流的平稳性越好。

在固定的稳定标准和初始划分下,数据流越平稳,得到的稳定集合越多,由稳定集合组成的信息结构越精细,其Shannon熵越大,其非平稳程度越小;反之,得到的稳定集合越少,Shannon熵越小,其非平稳程度越大[33]。

数据流非平稳性度量可用于模型选择,例如,用于区分趋势平稳序列与差分平稳序列以及独立同分布序列、白噪声序列和鞅差序列等[40],也可用于风载荷信号的非平稳性度量[41]和数据挖掘等数据分析中。

2 随机信号非平稳性时频域度量方法

2.1 基于短时Fourier变换的平稳性度量

傅里叶变换是一种传统的信号分析工具,通过在全局上定义统一的谐波成分线性组合来表示信号,但它在信号分析时没有时频定位的功能。Gabor于1946年提出了短时傅里叶变换(Short-time Fourier transform,STFT)。为使变换具有时域局部性,STFT对加窗后的信号做Fourier变换,得到信号的短时谱。

信号x(n)的短时Fourier变换定义为[42]

(29)

式中w(n)为窗函数。

对于非平稳信号,其短时频谱是时变的[43],因此根据信号的短时幅度谱可判别随机信号的非平稳性。STFT提高了时频分辨率且计算简单,在语音处理、生物医学信号处理等领域得到广泛应用,但其对信号做了局部平稳假设,因此存在较大误差,限制了其应用。

2.2 基于Hilbert变换的平稳性度量

与短时Fourier变换相比,局域波分解是将复杂的非平稳随机信号分解为有限个基本模式分量。使用经验模态分解[44,45]能得到非平稳随机信号基本模式分量。由于局域波分析是基于信号局部特征,因此它适用于非线性、非平稳随机信号分析。局域波分解与Hilbert变换可用于计算信号的非平稳度[46]。

将长度为N的信号x(n)进行经验模态分解,得到M个基本模式分量c1,c2,…,cM和剩余分量rM,即

(30)

对每个基本模式分量进行Hilbert变换,则有

(31)

信号x(n)的Hilbert谱表达式为

(32)

其中

信号x(n)的Hilbert边界谱为

(33)

平均边界谱定义为

(34)

平稳度定义为

(35)

平稳度DS(ω)能够定量检测数据的平稳性。对于平稳过程,Hilbert谱不随时间变化,它只包含水平的等高线,此时DS(ω)=0;如果Hilbert谱依赖于时间,DS(ω)将不为零,随着DS(ω)增大,信号的不平稳程度增强。

希尔伯特-黄变换(Hilbert-Huang transform,HHT)由美籍华人黄锷在1998年首次提出,这是一种描述非线性、非平稳信号的自适应方法[47]。HHT方法对随机信号进行时频分析,能够获得有意义的瞬时频率,从而可给出频率随时间变化的精确表达,信号最终表示为时频平面上的能量分布,成为Hilbert谱[48]。这种方法可将复杂的信号直接分离成从高频到低频的若干阶固有模态函数。工程实际中的动态信号大都是非线性、非平稳信号,例如风载荷信号[49]、复杂机器的振动信号[50]、生物信号[51]以及地震信号等。通常,将经过EMD分解后的信号进行Hilbert谱变换,根据平稳度参数就可度量上述非线性、非平稳信号[46]。文献[52]对含噪语音进行小波包分解,对各分量分别进行经验模态分解,建立语音信号的Hilbert谱和瞬时能量谱,并根据平稳度进行语音端点检测。为了抑制EMD的模态混叠,Huang等提出了集合经验模态分解(Ensemble empirical mode decomposition,EEMD)[53]。该方法先将信号进行EEMD分解,再进行Hilbert谱变换,因此可更好地表征原信号的各个分量,提高度量非平稳信号的准确度。

2.3 基于替代数据的平稳性度量

替代数据(Surrogate data)的概念最初由Theiler等[54]提出。基于替代数据的平稳性度量是引入“可控噪声”,即替代数据,由于构建的替代数据与原数据具有相同的统计特性,因此它可作为平稳性的判别准则。对于时间序列x(t),根据Theiler的方法,替代数据为

(36)

式中:φf是在[0,2π]均匀分布的随机相位;X(f)为原数据x(t)的Fourier变换。

由这种方法产生的替代数据S(n)是平稳的,同时保持了原数据的二阶统计特性和功率谱的幅度值不变。时频分布(Time-frequency distribution,TFD)能表示信号功率谱随时间的变化情况。信号x(t)的时频分布Sx,K(t,f)为[55]

(37)

式中:K是Hermite多项式的最高阶数;hk(t)是k阶Hermite函数,即

(38)

此处Hk(n)为k阶Hermite多项式,其递推表达式为

(39)

(40)

式中κ表示求距离,即

(41)

式中符号“~”表示对应函数的归一化函数。

(42)

3 基于随机信号模型的非平稳性度量参数

3.1 基于自回归模型的线性预测方法

信号预测是通过对时间序列进行分析,来预测下一时刻或以后若干时刻的信号[43]。实际中存在一类非平稳随机信号,其统计特性在一些时间段内保持平稳,这时可用分段平稳模型法来研究[2]。在线性预测中,常采用自回归(Auto-regression,AR)模型[2],其传递函数[58]为

(43)

式中:G为模型增益;ai为预测系数。

若序列x(n)前p个样值x(n-1),x(n-2),…,x(n-p)已知,则当前时刻的预测值为

(44)

残差信号为

(45)

语音处理中,通常假设语音信号是短时平稳的,因此可用AR模型对其进行建模[10]。根据对随机信号线性预测的准确性,可定性分析信号样本之间的相关性,进而分析其平稳性。对统计特性在一些未知时刻突变的非平稳随机信号,可用线性预测方法估计其突变的位置,因此可用于瞬态噪声检测。在文献[59-63]中,Talmon等用线性预测方法对语音中的瞬态噪声进行检测,其原理主要利用语音信号在时域的强自相关性以及瞬态噪声的突发性,即通过估计每帧带噪语音信号的AR模型参数,对其进行白化处理(或称作解相关),得到残差信号e(n);然后对残差信号进行STFT变换,计算出残差信号的频域向量E(k);最后根据语音信号与含噪信号E(k)之间欧氏距离较大的特点,估计语音信号中瞬态噪声的位置。此外,线性预测在语音端点检测[64]、语音压缩和编码[65]等领域具有广泛应用。

在电力系统中,风能转换系统的输出功率随着风速变化而波动,显然这是一种典型的非平稳过程。文献[66]用差分自回归滑动平均模型对风速进行建模,用于估计风能转换系统输出功率,提高电力系统的可靠性。

3.2 基于非线性模型的非线性交叉预测方法

与线性预测使用的AR模型不同,非线性交叉预测(Non-linear cross prediction,NLCP)使用了非线性模型来计算信号的非平稳度。Schreiber[6]于1997年首先提出NLCP,并利用NLCP的预测误差(也就是一个数据段对另一数据段的预测能力)来判别时间序列的非平稳性[67]。

(46)

(47)

用预测均方误差γ(X,Y)可衡量随机信号x(n)的非平稳性。NLCP对随机信号非平稳度给出了定量分析,可用于工程中非平稳信号度量。文献[68]已将NLCP方法成功用于EEG脑电信号分析。

4 特定类别信号的非平稳性度量方法

在实际中,存在一些具有特定性质的非平稳信号。例如,当非平稳随机信号的均值具有趋向性时,从其中减去均值后,可将其转化为平稳随机信号,此类信号称为均值具有趋向性的非平稳随机信号,或方差平稳随机信号。在通信等系统中,周期信号的非平稳性表现为周期平稳,其统计特性呈周期或多周期平稳变化,通常将此类信号统称为循环平稳或周期平稳信号[2]。还有一类冲激衰减(振荡或非震荡)信号,其存在时间通常比观测时间短很多,此类信号常称为暂态信号[2]。鉴于这些特殊的非平稳随机信号也广泛存在,下面给出针对它们的非平稳性度量方法。

4.1 基于周期平稳度的非平稳性度量

有些物理现象其本身具有周期性,如机械的振动以及齿轮、链条及活塞的转动、旋转与往复产生的周期性变化;社会、经济中的一些数据,也常存在周期性变化的现象。这类非平稳信号的主要特征是其均值和自相关函数呈现出周期性或拟周期性,因此称其为周期性平稳随机信号,周期性相关平稳随机信号,或周期性非平稳随机信号。

周期平稳度(Degree of cycle stationary,DCS)可用来度量随机信号的周期平稳性。DCS使用了非平稳随机过程x(t)的时变自相关函数rxx(t,τ)。周期平稳度可用时变自相关函数rxx(t,τ)与广义平稳随机过程的自相关函数rxx(τ)之间的距离来描述,即[2]

(48)

式中“<·>”表示算术平均。利用Parseval关系,DCS也可用时变功率谱Sx(t,f)与功率谱Sx(f)间的距离定义

(49)

对所有随机过程,DCS≥0。对平稳随机过程,有DCS=0,而周期性平稳随机过程的DCS>0,并且周期平稳度越大,信号的非平稳性越明显[2]。

周期平稳度已应用于无线通信信号处理[69]和机械设备故障诊断中[70]。式(48)定义的周期平稳度为二阶统计量,文献[70]指出,也可用高阶周期平稳度来分析非平稳随机过程。高阶周期平稳度可用来分离出平稳和周期平稳信号,抑制平稳噪声以及非平稳的高斯噪声,还可表征非线性系统以及恢复时变的相位信息。但是,高阶周期平稳度的分析需要更长的时间序列,样本数的增加会导致计算量的明显增大。

4.2 基于Gabor变换的暂态信号非平稳性度量

暂态信号是一种冲激衰减(振荡或非振荡)信号,其特点是信号存在时间比观测时间要短很多。如果对信号形状有一定的先验知识,可用Gabor变换对暂态信号进行检测。

考虑如下假设检验问题:

假设暂态信号的Gabor展开系数为amn,0≤m≤M-1,n∈N′不等于零,其中N′是值域[0,N-1]内的一个子集,含有K个整数。

对于L维随机向量X,在H0假设下,向量X为零均值、协方差矩阵为Λ的正态分布,其对数概率密度函数为

(50)

式中det(Λ)为矩阵Λ的行列式。

在H1假设下,设向量X的P个元素有非零均值,且它们的位置一致,而其他L-P个元素的均值为零。对向量X进行重排,前P个元素具有非零均值,且Λ的相应行和列也做重排。于是X的概率密度函数为

(51)

式中L=(2M-1)N,P=(2M-1)K;X1和μ为P×1维向量;X2为(L-P)×1维向量。

暂态信号的检测对应于式(50,51)。广义似然比定义为

(52)

广义似然比T具有以下性质[43]:

(53)

T在H0假设下的分布可用来设定虚警概率的门限,而在H1假设下的分布则将检测概率表示为实际暂态信号的Gabor展开系数。Gabor展开与广义似然比的计算详见文献[43]。

文献[43]用Gabor系数作检测统计量,对噪声背景下的暂态信号进行检测,文献[71]用过采样Gabor展开对暂态信号进行鲁棒检测。

4.3 基于听觉感知的MFCC平稳性度量

梅尔(Mel)倒谱系数(Mel frequency cepstrum coefficient,MFCC)由Davies和Mermelstein首先提出[72],它是利用听觉感知原理和倒谱的解相关特性来描述语音特征。MFCC是在Mel标度频率域提取出来的倒谱参数。Mel标度描述了人耳频率的非线性特性,它与频率的关系可近似表示为[73]

(54)

式中f是以Hz为单位的频率。

Mel倒谱系数的提取过程如图1所示。

图1 MFCC参数的提取过程Fig.1 MFCC extraction process

将时域信号做时/频变换后,对其对数能量谱用Mel刻度分布的三角滤波器组做卷积,再对滤波器组的输出进行离散余弦变换,就可得到MFCC。

对输入的语音信号x(n)进行分帧和加窗处理后,其短时傅里叶变换为

(55)

将能量谱通过图2所示的Mel刻度三角形滤波器组,计算每个滤波器输出的对数能量,即

(56)

(57)

式中:Ll和Ul分别表示各滤波器在非零取值区间的最低频率和最高频率;Al的作用是根据每个滤波器的带宽对滤波器组进行归一化处理,使得对平坦频谱的输入,各滤波器将输出相等的能量。

图2 Mel滤波器组Fig.2 Mel filter bank

MFCC系数为

(58)

式中R为滤波器个数。

平稳随机信号或准平稳随机信号的MFCC变化缓慢,而非平稳随机信号则反之,因此可用信号不同时间点的倒谱距离判断其平稳性。文献[74]就利用非平稳信号的MFCC变化剧烈的特性来检测水下非平稳瞬态信号。MFCC是根据人耳听觉特性所设计,对输入信号不做任何假设和限制,因此具有良好的鲁棒性。此外,当信噪比降低时,MFCC仍然具有较好的识别性能,已广泛应用于说话人识别和语音识别中[75]。

同样基于人耳听觉模型,文献[76]用指数压缩来模拟人耳非线性压缩,提出了伽马通滤波器(Gammatone filter,GT)。伽马通倒谱系数(Gammatone cepstral coefficient,GTCC)用伽马通滤波器代替MFCC中的三角滤波器,具有良好的识别性能和鲁棒性,可用于度量随机信号的平稳度,并在语音识别、非语音信号分类[77]和微弱信号提取[78]等领域得到应用。

5 结 论

非平稳性度量是非平稳信号处理中的重要课题。非平稳信号类型多,应用领域广,已有的信号非平稳性度量方法在原理上差异大,缺少统一的理论框架和度量标准,目前还很难找到一种统一的度量参数适用于所有的非平稳信号,因此每个应用领域都采用不同的度量方法研究其非平稳特性。本文从度量参数的类别方面,系统归纳总结了不同领域现有的信号非平稳性度量方法和应用情况。

(1) 时域的度量参数。如基于统计量的短时参数、自相关参数以及高阶累积量等,非线性动力学非平稳性度量的关联维数、近似熵和Hurst指数等;主要应用领域包括语音处理、图像处理、地震勘探、故障诊断、振动分析、生物医学和大气水文等领域。

(2) 时频域的度量方法。如短时傅里叶变换、基于模式分解的Hilbert变换和基于替代数据的平稳性度量;主要应用在工程实际中的风载荷信号、复杂机器的振动信号、生物信号以及地震信号等领域。

(3) 基于模型的度量方法。如基于AR模型的线性预测误差、NLCP模型的非线性预测误差;主要应用于语音噪声抑制、语音端点检测、语音压缩和编码以及生物医学等领域。

(4) 针对特定类别非平稳信号的度量。如基于周期平稳度的方法、基于Gabor变换的暂态信号度量以及基于听觉感知的MFCC非平稳性度量,这些度量方法利用了信号各自特点,并取得了较好的度量效果。

总之,随机信号的非平稳性度量具有重要意义,对信号非平稳性度量准确与否,关系到能否精确、定量地研究非平稳信号。目前,对随机非平稳信号度量的研究还处在初始发展阶段,各领域对随机信号非平稳性的度量方法、度量标准和准确度各异,如何寻找合适的度量方法,使用合适的度量参数,在提高度量准确度的同时降低计算复杂度,则是面临的主要挑战。虽然在众多类型的非平稳信号中很难找到一种普适的度量标准,但并非无迹可寻。在未来随机信号非平稳性度量的研究中,可以考虑在每个领域内定义一种度量信号非平稳性的统一标度。实际使用时,在本领域内的标度下,根据研究目的和信号分析处理的要求,寻找一种合适的非平稳性度量参数,该度量参数可以是直接反映信号特点的参数,也可以是间接反映信号平稳性的参数,而且这种度量参数既要便于测量和计算,又要具有精确度高、能真实地反映信号的非平稳特性的特点。此外,也要进一步探索统一的度量标准,以便对不同信号的非平稳度进行比较,便于对各领域的非平稳信号进行非平稳性分析和处理。

[1] 王宏禹.随机数字信号处理[M].北京:科学出版社,1988.

Wang Hongyu. Random digital signal processing [M].Beijing: Science Press, 1988.

[2] 王宏禹.非平稳随机信号分析与处理[M].北京:国防工业出版社,1999.

Wang Hongyu. Nonstationary random signal analysis and processing [M]. Beijing: National Defence Industry Press, 1999.

[3] Moon H R, Perron B. Beyond panel unit root tests: Using multiple testing to determine the nonstationarity properties of individual series[J].Journal of Econometrics, 2012, 169(1): 29-33.

[4] Friedman J, Hastie T, Tibshirani R. The elements of statistical learning [M]. Second edition. Springer: New York Verlag, 2009.

[5] 陈雄强.分位数自回归模型理论与应用研究[D].天津:南开大学,2013.

Chen Xiongqiang.The study on theory and application of quantile autoregression model[D].Tianjin, China: Nankai University, 2013.

[6] Deng X, Pang Z, Ding J, et al. Nonlinear cross prediction analysis of water vapor time series with fractal interpolation[C]∥ 2nd International Conference on Remote Sensing, Environment and Transportation Engineering (RSETE). Nanjing: IEEE, 2012: 1-3.

[7] Rieke C, Sternickel K, Andrzejak R G, et al. Measuring nonstationarity by analyzing the loss of recurrence in dynamical systems [J].Physical Review Letter, 2002, 88(24): 244102.

[8] Pan J, Tang Y. Nonstationary signal analysis based on EMD and extremum points[C]∥ International Conference on Wavelet Analysis and Pattern Recognition (ICWAPR). Xi′an: IEEE, 2012: 260-265.

[9] 张延丽.非平稳度量方法及其在生物医学图像与信号处理中的应用[D].哈尔滨:哈尔滨工业大学,2013.

Zhang Yanli. A general non-stationarity measure and applications to biomedical image and signal processing [D]. Harbin, China: Harbin Institute of Technology, 2013.

[10]杨行峻,迟慧生.语音信号数字处理[M].北京:电子工业出版社,1995.

Yang Xingjun, Chi Huisheng. Digital processing of the speech signal [M]. Beijing: Publishing House of Electronics Industry, 1995.

[11]Bachu R G, Kopparthi S, Adapa B, et al. Advanced techniques in computing sciences and software engineering[M]. Dordrecht: Springer,2010:279-282.

[12]Zhang Shuyin, Guo Ying, Wang Buhong. Auto-correlation property of speech and its application in voice activity detection[C]∥ International Workshop on Education Technology and Computer Science. Wuhan: IEEE, 2009, 3: 265-268.

[13]张万宏.非平稳时间序列的预测方法研究[D].兰州:兰州理工大学, 2007: 18.

Zhang Wanhong. Study of method on non-stationary time series prediction [D]. Lanzhou: Lanzhou University of Technology, 2007: 18.

[14]Shahnaz C, Zhu W P, Ahmad M O. Pitch estimation based on a harmonic sinusoidal autocorrelation model and a time-domain matching scheme[J].IEEE Transactions on Audio, Speech, and Language Processing, 2012, 20(1): 322-335.

[15]管鹏.非平稳时间序列建模与预测[D]. 兰州:兰州大学, 2006:6.

Guan Peng. Non-stationary time series modeling and forecasting [D]. Lanzhou: Lanzhou University, 2006:6.

[16]李鹏勇.基于全矢高阶谱的故障诊断方法及其应用研究[D]. 郑州:郑州大学, 2010: 8-13.

Li Pengyong. Fault diagnosis method based on vetor-HOS and its application [D]. Zhengzhou: Zhengzhou University, 2010: 8-13.

[17]黄畅.基于高阶累积量的低信噪比复杂信号识别研究[D]. 武汉:华中科技大学, 2004: 30-40.

Huang Chang. Research on complex signal identification based on high-order cumulant under low signal/noise rate [D]. Wuhan: Huazhong University of Science and Technology, 2004: 30-40.

[18]苏野平,何量,杨荣震,等. 一种改进的基于高阶累积量的语音盲分离算法[J].电子学报, 2002, 30(7): 956-958.

Su Yeping, He Liang, Yang Rongzhen, et al. An improved higher order cumulants based blind speech separation method [J].Acta Electronic Sinica, 2002, 30(7): 956-958.

[19]冯正权,何庆华,吴宝明,等. 基于高阶统计量分析的生物医学信号处理应用[J].中国医学物理学杂志,2011,28(5):2899-2903.

Feng Zhengquan, He Qinghua, Wu Baoming, et al. Higher order statistics analysis in biomedical signal processing [J]. Chinese Journal of Medical Physics,2011,28(5):2899-2903.

[20]李希亮,刘希强,董晓娜,等.高阶统计量方法在地球物理学中的应用与展望[J].西北地震学报,2010,32(2):201-205.

Li Xiliang, Liu Xiqiang, Dong Xiaona, et al. Application and expectation of higher-order statistics in geophysics [J].Northwestern Seismological Journal, 2010,32(2):201-205.

[21]Guan Y, Du K, Shen F, et al. A novel high-order statistics map based method for depth map generation of static scene[C]∥ Seventh International Conference on Image and Graphics (ICIG). Qingdao: IEEE, 2013:603-606.

[22]夏天,王新晴,赵慧敏,等.基于高阶累积量的柴油发动机曲轴轴承故障特征提取[J].振动与冲击,2011,30(1):77-81.

Xia Tian, Wang Xinqing, Zhao Huimin, et al. Extracting fault features of a diesel engine′s crankshaft bearing based on high-order cumulation[J].Journal of Vibration and Shock, 2011, 30(1): 77-81.

[23]Mandelbrot B B. The fractal geometry of nature[M]. New York: Whfreeman, 1983.

[24]辛厚文.分形理论及其应用[M].合肥:中国科学技术大学出版社,1993.

Xin Houwen. Fractal theory and its application [M]. Hefei: Press of University of Science and Technology of China, 1993.

[25]Takens F. Detecting strange attractors in turbulence[J]. Lecture Notes in Mathematics, Berlin Springer Verlag, 1981, 898: 366.

[26]Li Wei, He Qianhua, Li Yanxiong. Fractal dimension feature for distinguishing between overlapped speech and single-speaker speech[C]∥ International Conference on Machine Learning and Cybernetics (ICMLC). Xi′an: IEEE, 2012, 1: 148-151.

[27]武薇,范影乐,庞全.基于广义维数距离的语音端点检测方法[J].电子与信息学报,2007,29(2): 465-468.

Wu Wei, Fan Yingle, Pang Quan. A speech endpoint detection method based on the feature distance of generalized dimension[J].Journal of Electronics & Information Technology,2007,29(2): 465-468.

[28]Nugroho H A, Joelianto E, Puspito N T. Characteristics of earthquake occurrences based on chaotic analysis and fractal dimension[C]∥ IEEE Conference on Control, Systems & Industrial Informatics (ICCSII). Indonesia, Bandung: IEEE, 2012: 208-213.

[29]郝研.分形维数特性分析及故障诊断分形方法研究[D].天津:天津大学,2012.

Hao Yan. Research on fractal dimension characteristics and methodology of fractal fault diagnosis [D].Tianjin:Tianjin University,2012.

[30]Ivanovici M, Richard N. Fractal dimension of color fractal images[J].IEEE Transactions on Image Processing, 2011, 20(1): 227-235.

[31]Pincus S M. Approximate entropy as a measure of system complexity[J]. Proceedings of the National Academy of Sciences, 1991, 88(6): 2297-2301.

[32]Kale K K, Gawande J P. Automated feature extraction of epileptic EEG using approximate entropy[C]∥ 12th International Conference on Hybrid Intelligent Systems (HIS). Pune, India: IEEE, 2012: 474-477.

[33]Lv Jianxin, Wu Husheng, Tian Jie. Feature extraction & application of engineering non-stationary signals based on EMD-approximate entropy[C]∥ International Conference on Computer, Mechatronics, Control and Electronic Engineering (CMCE). Changchun: IEEE, 2010, 5: 222-225.

[34]金红梅.近似熵对气候突变检测的适用性研究[D]. 兰州:兰州大学,2013.

Jin Hongmei. The applicability research of approximate entropy in abrupt climate change detection [D]. Lanzhou: Lanzhou University, 2013.

[35]牛奉高,刘维奇.分数布朗运动与Hurst指数的关系研究[J].山西大学学报(自然科学版), 2010,33(3): 380-383.

Niu Fenggao, liu Weiqi. Relationship research between fractional Brownian motion and Hurst index [J].Journal of Shanxi University (Natural Science), 2010,33(3):380-383.

[36]谢平,陈广才,雷红富.基于Hurst系数的水文变异分析方法[J].应用基础与工程科学学报,2009, 17(1):32-39.

Xie Ping, Chen Guangcai, Lei Hongfu. Measures of the hydrological variation analysis based on Hurst index[J].Journal of Basic Science and Engineering,2009,17(1):32-39.

[37]臧妻斌,黄腾,郭献涛.重标极差分析法在地铁变形监测中的应用[J].测绘科学,2015,40(2):84-87.

Zang Qibin, Huang Teng, Guo Xiantao. Rescaled range analysis applied in underground deformation monitoring[J].Science of Surveying and Mapping,2015,40(2):84-87.

[38]孙梅玉.基于分形的非平稳时间序列挖掘关键技术研究[D].上海:东华大学,2009.

Sun Meiyu. Research on key issues of stochastic non-stationary time series data mining based on fractal theory[D]. Shanghai, China:Donghua University, 2009.

[39]张育培.非平稳数据流的概念漂移检测及其分类[D].郑州:郑州大学,2013.

Zhang Yupei. Concept-drifting detection and classification in non-stationary data streams [D].Zhengzhou:Zhengzhou University,2013.

[40]丁义明,范文涛,谭秋衡,等.数据流的非平稳性度量[J]. 数学物理学报,2010,30A(5):1364-1376.

Ding Yiming, Fan Wentao, Tan Qiuheng, et al. Measurement of non-stationarity date stream[J].Acta Mathematica Scientia,2010,30A(5):1364-1376.

[41]董凯华. 非平稳风评价及其对结构风荷载的影响[D].北京:北京交通大学,2015.

Dong Kaihua. Evaluation of the non-stationary wind and its effect on structural wind loads [D].Beijing: Beijing Jiaotong University, 2015.

[42]Cover T M, Thomas J A. Elements of information theory [M]. 2nd edition. New York: Wiley-Blackwell, 2006.

[43]张贤达,保铮.非平稳信号分析与处理[M].北京:国防工业出版社, 1999: 144-149.

Zhang Xianda, Bao Zheng. Non-stationary signal analysis and processing [M]. Beijing: National Defence Industry Press, 1999: 144-149.

[44]马社祥,刘贵忠,曾召华.基于小波分析的非平稳时间序列分析与预测[J].系统工程学报,2000,15(4):305-311.

Ma Shexiang, Liu Guizhong, Zeng Zhaohua. Wavelet-based analysis and forecasting for non-stationary time series[J].Journal of Systems Engineering,2000,15(4):305-311.

[45]王晓兰,张万宏,王慧中.基于小波变换和AR-LSSVM的非平稳时间序列预测[J].控制与决策,2008,23(3):357-360.

Wang Xiaolan, Zhang Wanhong, Wang Huizhong. Analysis and forecasting for non-stationary time series based on wavelet and AR-LSSVM[J].Control and Decision,2008,23(3):357-360.

[46]张海勇.基于局域波法的非平稳随机信号分析中若干问题的研究[D]. 大连: 大连理工大学, 2001: 25-36.

Zhang Haiyong. Research on the problems of non-stationary random signal analysis and processing based on local wave method [D]. Dalian: Dalian University of Technology, 2001: 25-36.

[47]Huang N E. Hilbert-Huang transform and its applications [M]. Singapore: World Scientific, 2014.

[48]刘群群,何文平,顾斌.非线性动力学方法在气候突变检测中的应用[J].物理学报,2015,64(17):428-436.

Liu Qunqun, He Wenping, Gu Bin. The application of nonlinear dynamics methods in climate change [J].Acta Physica Sinica,2015,64(17):428-436.

[49]赵杨,武岳,曹曙阳,等.利用HHT方法对非平稳风力的时频分析[J].振动与冲击,2011,30(2):5-9,14.

Zhao Yang, Wu Yue, Cao Shuyang. Time-frequency analysis of a non-stationary wind pressure with HHT method [J].Journal of Vibration and Shock,2011,30(2):5-9,14.

[50]李昌林,孔凡让,黄伟国,等. 基于EEMD和Laplace小波的滚动轴承故障诊断[J]. 振动与冲击,2014, 33(3): 63-69,88.

Li Changlin, Kong Fanrang, Huang Weiguo, et al. Rolling bearing fault diagnosis based on EEMD and Laplace wavelet [J].Journal of Vibration and Shock, 2014,33(3):63-69,88.

[51]胡广书,汪梦蝶.生物医学信号处理研究综述[J].数据采集与处理,2015, 30(5): 915-932.

Hu Guangshu, Wang Mengdie. Survey on biomedical signal processing [J].Journal of Data Acquisition and Processing,2015,30(5):915-932.

[52]陈金龙,范影乐,倪红霞,等. 基于小波包分解的含噪语音时频特性分析及端点检测[J]. 数据采集与处理,2014,29(2):293-297.

Chen Jinlong, Fan Yingle, Ni Hongxia, et al. Endpoint detection of noise-corrupted speech time-frequency characteristics based on wavelet packet decomposition [J]. Journal of Data Acquisition and Processing,2014,29(2):293-297.

[53]Wu Z, Huang N E. Ensemble empirical mode decomposition: A noise-assisted data analysis method [J]. Advances in Adaptive Data Analysis, 2009, 1(1): 1-41.

[54]Theiler J, Eubank S, Longtin A, et al. Testing for nonlinearity in time series: The method of surrogate data [J]. Physica D: Nonlinear Phenomena, 1992, 58(1/2/3/4): 77-94.

[55]Bayram M, Baraniuk R G. Nonlinear and nonstationary signal processing [M]. Cambridge: Cambridge University Press, 2000: 292-316.

[56]卢宇,贺国光. 基于改进型替代数据法的实测交通流的混沌判别[J]. 系统工程,2005,23(6):21-24.

Lu Yu, He Guoguang. The discriminant in traffic chaos based on modified surrogate data method[J].System Engineering,2005,23(6):21-24.

[57]雷敏,王志中. 替代数据法在肌电信号分析中的应用[J].上海交通大学学报,2000,34(11):1594-1597.

Lei Min, Wang Zhizhong. Application of surrogate data method in electromyograph analysis[J].Journal of Shanghai Jiaotong University,2000,34(11):1594-1597.

[58]王炳锡,王洪.变速率语音编码[M].西安:西安电子科技大学出版社,2004: 16-22.

Wang Bingxi, Wang Hong. Variable rate speech coding [M]. Xi′an: Xidian University Press, 2004: 16-22.

[59]Talmon R, Cohen I, Gannot S. Transient noise reduction using nonlocal diffusion filters [J]. IEEE Transactions on Acoustics, Speech and Signal Processing, 2011, 19(6):1584-1599.

[60]Talmon R, Cohen I, Gannot S. Speech enhancement in transient noise environment using diffusion filtering [C]∥ IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP). Dallas, USA: IEEE, 2010: 4782-4785.

[61]Talmon R, Cohen I, Gannot S. Clustering and suppression of transient noise in speech signals using diffusion maps [C]∥ IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Czech, Prague: IEEE, 2011: 5084-5087.

[62]Hiszhom A, Dov D, Talmon R, et al. Transient interference suppression in speech signals based on the OM-LSA algorithm[C]∥ International Workshop on Acoustic Signal Enhancement. Aachen, Germany: VDE, 2012: 1-4.

[63]Talmon R, Cohen I, Gannot S. Single-channel transient interference suppression with diffusion maps [J].IEEE Transactions on Audio, Speech and Language Processing, 2013, 21(1):130-142.

[64]刘华平,李昕,徐柏龄,等.语音信号端点检测方法综述及展望[J].计算机应用研究,2008,25(8):2278-2283.

Liu Huaping, Li Xin, Xu Bailing, et al. Summary and survey of endpoint detection algorithm for speech signals[J].Application Research of Computers, 2008, 25(8): 2278-2283.

[65]Osman M A, Nasser A, Hussein M, et al. Speech compression using LPC and wavelet [C]∥ 2nd International Conference on Computer Engineering and Technology (ICCET). Chengdu, China: IEEE, 2010: 16-18.

[66]Rajeevan A K, Shouri P V, Nair U. ARIMA modeling of wind speed for wind farm reliability analysis [C]∥ Annual International Conference on Emerging Research Areas: Magnetics, Machines and Drives. Kottayam, India: IEEE, 2014:1- 5.

[67]Schreiber T. Detecting and analyzing nonstationarity in a time series using nonlinear cross predictions [J]. Physical Review Letters, 1997, 78(5): 843-846.

[68]王兴元,谭贵霖. Liley 模型的模拟EEG信号的非线性预测和分析[J].计算物理, 2007, 24(5): 612-618.

Wang Xingyuan, Tan Guilin. Nonlinear prediction and analysis of EEG in a Liley model [J].Chinese Journal of Computational Physics, 2007, 24(5): 612-618.

[69]Prithiviraj V, Sarankumar B, Kalaiyarasan A, et al. Cyclostationary analysis method of spectrum sensing for cognitive radio[C]∥ 2nd International Conference on Wireless Communication, Vehicular Technology, Information Theory and Aerospace & Electronic Systems Technology (Wireless VITAE). Chennai, India: IEEE, 2011: 1-5.

[70]周福昌,陈进,何俊,等.循环平稳信号处理在机械设备故障诊断中的应用综述[J].振动与冲击,2006,25(5):148-152,198.

Zhou Fuchang, Chen Jin, He Jun, et al. Survey of cycle stationary signal processing applications in fault diagnosis[J].Journal of Vibration and Shock,2006,25(5):148-152,198.

[71]Lee N, Schwartz S C. Robust transient signal detection using the oversampled Gabor representation [J]. IEEE Transactions on Signal Processing, 1995, 43(6): 1498-1502.

[72]Davies S B, Mermelstein P. Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences[J].IEEE Transactions on Acoustics, Speech, and Signal Processing, 1980, 28(4): 357-366.

[73]Quatieri T F. 离散时间语音信号处理-原理与应用[M].赵胜辉,刘家康等,译.北京:电子工业出版社, 2004: 566-568.

Quatieri T F. Discrete-time speech signal processing:Principles and practice [M]. Beijing: Publishing House of Electronics Industry, 2004: 566-568.

[74]Taegyum L, Keunsung Bae, Chansik H, et al. Classification of underwater transient signals using MFCC feature vector[C]∥ 9th International Symposium on Signal Processing and Its Applications (ISSPA). Sharjah, United Arab Emirates: IEEE,2007: 1-4.

[75]Nakagawa S, Wang L B, Ohtsuka S. Speaker identification and verification by combining MFCC and phase[J].IEEE Transactions on Information Audio, Speech, and Language Processing, 2012,20(4): 1085-1095.

[76]Irino T, Patterson R D. A time-domain, level-dependent auditory filter: The gammachirp [J]. The Journal of the Acoustical Society of America, 1997, 101(1): 412-419.

[77]Valero X, Alias F. Gammatone cepstral coefficients: Biologically inspired features for non-speech audio classification[J].IEEE Transactions on Multimedia, 2012, 14(6): 1684-1689.

[78]李允公,戴丽,张金萍.一种双耳听觉模型及其在轴心轨迹分析中的应用[J].振动与冲击,2012,31(18):46-49.

Li Yungong, Dai Li, Zhang Jinping. A binaural auditory model and its application in shaft orbit analysis [J]. Journal of Vibration and Shock,2012,31(18):46-49.

Review on Measurement Parametrics and Methods for Nonstationary Signal

Chen Zhe, Wang Rong, Zhou Wenying, Yin Yin, Yin Fuliang

(School of Information and Communication, Dalian University of Technology, Dalian, 116024, China)

Measuring non-stationary level is an important topic in non-stationary signal processing. Although the existing measurement parameters and methods have obvious differences in principle and are not derived from a unified theoretical framework and metrics, these measurements play an important role in the corresponding fields. This paper summarizes the measurement parameters and methods for the non-stationary signals in different research fields systematically, including the statistic and dynamic parameters in time domain, the parameters in time-frequency domain, signal modeling parameters and specific non-stationary signal measurements. Moreover, the applications of various measurement parameters and methods are given briefly. Finally, the future work on the non-stationary signal measurements is also deduced.

non-stationary signal; non-stationary degree measurement; time-frequency representation; nonlinear; cycle-stationarity

国家高技术研究发展计划(“八六三”计划)(2015AA016306)资助项目;辽宁省自然科学基金(20170540159)资助项目;中央高校基本科研业务费专项资金(DUT13LAB04)资助项目;国家自然科学基金项目(61172107,61172110)资助项目。

2016-02-04;

2016-03-23

TN911.72

A

陈 喆(1975-),男,副教授,研究方向:数字信号处理、语音信号处理、图像处理和宽带无线通信,E-mail:zhechen@dlut.edu.cn。

殷殷(1994-),女,本科生,研究方向:图像处理、 随机信号处理。

王荣(1989-),女,博士研究生,研究方向:语音信号处理、随机信号处理。

殷福亮(1962-),男,教授,研究方向:数字信号处理、语音信号处理、图像处理以及宽带无线通信。

周文颖(1989-),女,硕士研究生,研究方向:语音信号处理、随机信号处理。

猜你喜欢
平稳性度量语音
鲍文慧《度量空间之一》
模糊度量空间的强嵌入
基于非平稳性度量的数字印章信息匹配
基于递归量化分析的振动信号非平稳性评价
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
高重合度齿轮传动的平稳性分析及试验