基于滑动分布熵的混沌状态识别

2020-12-28 12:47曾祥健

广州大学学报（自然科学版） 2020年3期

曾祥健, 万丽, 刘慧

(广州大学数学与信息科学学院, 广东广州 510006)

熵是度量系统复杂度的一种指标，一个系统状态的改变情况能够通过熵的变化来描述.自20世纪香农(Shannon)从概率统计的角度出发，提出了信息熵的概念之后，关于熵的理论和应用得到了迅速发展[1]；Pincus[2]于1991年提出的近似熵克服了Kolmogorov熵在应用中的困难和不足；Richman等[3]于2000年提出的样本熵(Sample Entropy, SampEn)解决了近似熵存在的自身数据段匹配的问题；而Bandt等[4]于2002年基于编码思想提出了具有较高鲁棒性和快速简单特征的排列熵(Permutation Entropy, PE).Li等[5]于2015年提出了分布熵(Distribution Entropy, DistEn)，并取得了良好的应用.近似熵、样本熵和排列熵等方法的计算结果严重依赖于嵌入维数和相似容限等预设参数，当嵌入维数或相似容限的取值超过某一特定范围会造成计算结果的恶化[6-7]，而分布熵不仅对预设参数的依赖很小，还具有这些方法不具有的高稳定性及对参数的低敏感性[8-9].本文将分布熵与滑动窗口技术相结合，提出滑动分布熵(Moving Distribution Entropy，M-DistEn)，将其运用在序列的混沌状态识别，并与滑动样本熵[10](Moving Sample Entropy，M-SampEn)和滑动排列熵[11](Moving Permutation Entropy，M-PE)相比较，探讨滑动分布熵在混沌状态识别的性能，为分布熵的实际应用提供参考.

1 理论与方法

1.1 DistEn算法

设时间序列为{u(i)，i=1,2,…,N}，分布熵的算法步骤如下[6]：

(1)相空间重构：选择嵌入维数m，构造向量X(i)={u(i),u(i+1),…,u(i+m-1)}(1≤i≤N-m+1)；

(2)构造向量距离矩阵：定义向量X(i)和X(j)间的切比雪夫距离di,j，di,j=max{|u(i+k)-u(j+k)|, 0≤i,j≤N-m-1, 0≤k≤m-1}，距离矩阵D={di,j}；

(3)建立经验概率密度函数：利用直方图法生成距离矩阵D的经验概率密度函数ePDF，设M为直方图的分组数，记落入第h组的概率为Ph(1≤h≤M)；

1.2 M-DistEn算法

M-DistEn方法是将滑动窗口技术与DistEn方法相结合的一种新方法，步骤是对原始时间序列从第一个数据开始选取长度为w的滑动窗口构成子序列，然后固定窗口w，以步长s滑动选取新的子序列，采用DistEn方法计算每个子序列的DistEn值，直到滑动窗口完全覆盖原序列，得到DistEn值序列，根据DistEn值序列的变化，判断原始时间序列的状态变化.

2 混沌状态识别

2.1 混沌序列的构造

Logistic映射是最常见的描述生物种群系统演化的数学模型，其方程如下：xn+1=xn(1-xn),xn∈[0,1].当3≤≤4时，系统由倍周期通向混沌，当参数达到极限值∞=3.569 945 673时，Logistic映射迭代时间序列终态为周期2∞，即系统此时进入混沌状态[12]，见图1(a).

(a)2.8<<4.0 (b)3.57<<3.70

Henon映射是被广泛应用的二维混沌映射，其方程如下[13]：

当a∈[1.07, 1.4]，b=0.3时，系统处于混沌状态中，见图2(a).

(a)0.0

为了便于检测M-DistEn方法的参数影响及其在混沌状态识别中的应用，构造由Logistic映射产生的理想序列IS1.取初始值x0=0.4，理想序列IS1的前2 000个数据的参数1=3.574，2 001至4 000数据的参数2=3.58，4 001至6 000数据的参数3=3.7，总长度为6 000.从IS1的构造可知，系统的演化由生长率较低的1变成较高的2，再到更高的3，见图1(b)，系统的复杂度也越来越高，其中2-1明显小于3-2，即第一段与第二段处于相差程度较小的混沌状态，第二段与第三段处于相差程度较大的混沌状态.

同样构造由Henon映射产生的理想序列IS2.取初始值x0=0.0，y0=0.0，b=0.3，理想序列IS2的前2 000个数据的参数a1=1.072，2 001至4 000数据的参数a2=1.078，4 001至6 000数据的参数a3=1.2，总长度为6 000.理想序列IS2中，a2-a1明显小于a3-a2，见图2(b)，与IS1类似，IS2中第一段与第二段处于相差程度较小的混沌状态，而第二段与第三段则处于相差程度较大的混沌状态.

2.2 算法参数的选取

首先，分析不同步长对M-DistEn计算结果的影响.选取滑动窗口为w=400，步长分别为10、20、50，并计算理想序列IS1、IS2的DistEn值，其中IS1的计算结果见图3(a)～图3(b)，IS2的计算结果见图3(d)～图3(f).图3(a)、图3(d)的步长为10，可以更为细微地观察到熵值的变化，有利于发现原序列中细微的状态变化，但计算时间相对较长，图3(b)、图3(e)对应步长为20，图3(c)、图3(f)对应步长为50.从图中可见，随着步长的增大，DistEn值的曲线变化更为平滑，但总体趋势是不变的，均能准确识别出IS1和IS2的三种混沌状态变化位置分别在2 001和4 001处，这说明M-DistEn方法对序列混沌状态的识别能力受步长影响较小，在步长较大的情况下也能准确识别序列的状态变化，在实际应用中可以灵活的根据数据长度选取合适的步长，提高计算速度.

图3 理想序列IS1及IS2的M-DistEn检测结果(基于不同步长)

其次，分析不同滑动窗口大小对混沌状态的识别能力，选取滑动步长s=20，滑动窗口大小分别为150、300、400，计算理想序列IS1、IS2的DistEn值，IS1的计算结果见图4(a)～图4(c)，IS2的计算结果见图4(d)～图4(f).可见，滑动窗口大小为150时，其熵值虽有波动，但也能准确识别出三种混沌状态，随着窗口大小的增加，其熵值也越来越稳定，对混沌状态的识别效果也更好，这说明虽然M-DistEn方法在滑动窗口较小的情况下仍然具有较为出色的识别能力，但为了保证DistEn值在不同混沌状态下的准确性和稳定性，滑动窗口不宜过少，理想滑动窗口大小应尽量在400以上.

图4 理想序列IS1及IS2的M-DistEn检测结果(基于不同窗口)

2.3 识别结果与讨论

为了说明M-DistEn方法在不同混沌状态识别上的优势，将M-DistEn、M-SampEn和M-PE这三种滑动熵方法对理想序列IS1和IS2的计算结果进行比较.

图5 IS1的三种滑动熵方法检测结果

图5(a)、图5(d)分别是M-DistEn方法在嵌入维数m=2和m=3时的计算结果，从图中可见，M-DistEn在不同嵌入维数下均能准确识别出序列IS1中相差较小的混沌状态和相差较大的混沌状态，且状态发生变化位置分别在n=2 001和n=4 001处，而随着参数的增大，序列的复杂度也增大，其DistEn值也增大，计算结果与实际意义一致.

图5(b)、图5(e)分别是M-SampEn方法在嵌入维数m=2和m=3时的计算结果，从图中可见，在不同嵌入维数下，对于相差较小的混沌状态，虽然样本熵值有增大的趋势，但在n=2 001处无法准确识别出序列的混沌状态发生了变化，而在n=4 001处熵值发生了明显变化，后2 000个数据的熵值明显增大，说明序列的状态发生了明显变化，序列复杂度增大，这说明M-SampEn方法可以准确识别IS1中相差较大的混沌状态[14]，但无法准确识别相差较小的混沌状态，且样本熵值在不同混沌状态下的波动较大，不如分布熵值稳定.

图5(c)、图5(f)分别是M-PE方法在嵌入维数m=2和m=3时的计算结果，从图5(c)可知，M-PE在嵌入维数m=2时，前4 000个数据的排列熵值保持不变，在n=4 001处排列熵值开始下降，错误地认为序列的复杂度降低，计算结果与实际意义不符，这是因为在嵌入维数m=2时重构向量中包含的状态太少，算法失去有效性，不能准确检测序列的状态变化[15-16]，因此，M-PE方法应避免在嵌入维数m=2时使用；从图5(f)可知，在嵌入维数m=3时，前4 000个数据的排列熵值保持不变，错误地认为前4 000个数据来源于同一参数的混沌状态，无法识别出前面两种相差较小的混沌状态，在n=4 001处排列熵值开始增大，说明序列的复杂度变高，与实际意义一致.因此，M-DistEn方法对差别较大的混沌状态和差别较小的混沌状态的识别能力均优于M-SampEn方法和M-PE方法.

三种滑动熵方法对理想序列IS2进行计算，结果见图6.从图6(a)、图6(d)可知M-DistEn方法不仅能准确识别出IS2中第二段与第三段相差较大的混沌状态，第一段与第二段相差较小的混沌状态也能准确识别；而图6(b)、图6(e)以及图6(c)、图6(f)的结果则表明，M-SampEn方法和M-PE方法只识别出了第二段与第三段相差较大的混沌状态，未能准确识别出IS2中第一段与第二段相差较小的混沌状态，即三种滑动熵方法对IS2的计算结果基本与IS1的计算结果一致.

3 结论

将DistEn方法与滑动窗口结合提出M-DistEn，基于Logistic映射和Henon映射构建了不同参数的混合序列(IS1，IS2)，以此检验M-DistEn方法对不同混沌状态的识别效果，并与M-SampEn方法、M-PE方法的结果进行对比.研究发现：M-DistEn在不同步长下和不同滑动窗口下均保持良好的混沌识别能力，表明该方法受步长的影响很小，而且DistEn值在滑动窗口较大时则更为稳定；对于理想序列IS1和IS2中差别较大的混沌状态，三种滑动熵方法在不同嵌入维数下均能准确识别出两种相差较大的混沌状态，但DistEn值的稳定性要优于SampEn值与PE值；而对于IS1和IS2中差别较小的混沌状态，只有M-DistEn方法能准确识别出混沌状态的微小差异，M-SampEn方法与M-PE方法则无法识别，且M-DistEn值序列波动小于M-SampEn值序列与M-PE值序列，指示M-DistEn方法的混沌状态识别最为有效，其识别结果的稳定性、准确性都优于M-SampEn方法和M-PE方法，为进一步应用提供参考.