自回归神经网络的电离层总电子含量预报

2018-12-03 06:59吉长东沈祎凡
导航定位学报 2018年4期
关键词:电离层个数神经元

吉长东,王 强,沈祎凡,潘 飞

(辽宁工程技术大学 测绘与地理科学学院,辽宁 阜新 123000)

0 引言

全球卫星导航系统(global navigation satellite system,GNSS),在各行各业都得到了广泛应用,当GNSS卫星信号穿过电离层时,预报电离层总电子含量(total electric contents,TEC)对研究电离层随时间变化和电离层暴都有着重要意义[1-2]。目前应用国际GNSS服务组织(international GNSS service,IGS)提供的格网数据建立高精度的TEC预报模型的方法在TEC短期预报中取得了很好的效果。具体包括自回归移动平均模型(auto regressive integrated moving average,ARIMA)[3]、指数平滑(Holt-Winters)模型[4]、神经网络模型[5-8]等。其中,神经网络以其优秀的学习能力、大规模并行处理海量数据能力以及其在处理非线性与时变性问题上有着巨大优势。但传统的前馈式神经网络预测模型属于一种非动态的非循环的神经网络模型,利用静态网络将动态时间序列建模问题当作静态建模问题,不能精确地反映TEC时间序列的特性,同时还存在着输入数据个数难以确定、容易陷入局部最小值和网络结构难以确定等不足。而非线性自回归(nonlinear auto regressive,NAR)神经网络模型[9-11]是一种动态的神经网络模型,能够记忆以往时间序列的信息并加入到当前的输出计算中。同时,采用动态神经网络来对动态系统进行预测,则能够更好地反映出TEC时间序列的动态变化特性。由于时间序列的复杂性直接对其利用模型预测并不能取得很好的效果,文献[12]首先利用经验模态分解(empirical mode decomposition,EMD)的方法对电离层TEC时间序列进行分解变换,再对分解后的各个序列分别建立模型进行预报,有效的提高了TEC值预报精度[12]。因此,本文采用经验模态分解[13-14]与非线性自回归神经网络模型相结合的方法对电离层TEC值进行短期预报,并利用均方根误差(root mean square error,RMSE)和日平均相对精度(relative accuracy,RA)来评定模型的预报精度。

1 算法原理

1.1 NAR动态神经网络

NAR模型全称是非线性自回归模型它是一种回归型的动态的循环神神经网络[9]。NAR模型可以实现时间序列依次多个输入输出,同时隐层之间采用自链接,展开后相当于时序之间的相互影响,具有时间观念。NAR动态神经网络模型在传统神经网络模型的输入层和输出层之前增加输入滞时和输出滞时来体现其动态特性。NAR模型的基本结构可以由图1表示[10]。

图1中:Y(t)表示神经网络的输入与输出;1∶12表示延时阶数,即t时刻的电离层TEC值受到y(t-1),y(t-2),…,y(t-12)时刻TEC值的影响;w为链接权值;b为阈值。NAR电离层TEC值预测模型的数学表达式为

y(t)=f(y(t-1),y(t-2),y(t-3),…,
y(t-n))

(1)

式中:t为当前时刻;n为延时变量的个数;(t-1),y(t-2),…,y(t-n)为模型过去时刻的输出值;y(t)表示当前时刻的预测值;f是通过网络训练的得到的非线性映射函数。具体的NAR网络结构如图2所示[11]。

图2中:Xi为网络的输入信号;Hj为隐含层神经元的输出;O(t)为网络的输出。计算公式为

(2)

(3)

式中:Hj为隐含层的输出;f为隐含层的激活函数;Xi为输入数据;wij为输入层第i个神经元到隐含层第j个神经元的系数(权值);aj为隐含层第j神经元的线性关系的偏倚;O为网络的输出;wj为隐含层第j个神经元到输出层的权连接值;b为输出层神经元的阈值。

NAR动态神经网络模型需要通过不断地调试参数,使得电离层TEC的预测值与真值得到有效拟合。其中隐含层节点数和延时阶数的选取对NAR动态神经网模型的创建起着决定性作用。隐层节点个数的选取目前还没有具体的数学公式,节点个数过多不仅会降低网络的运行速度,同时还容易出现过度拟合问题,网络的泛化能力降低;节点个数过少,虽然可以提高网络的运行速度,但网络的学习能力不够,导致网络的预报精度较差。隐含层节点数通常采用经验公式和大量试验的方法来确定。经验公式为

(4)

式中:n1为隐含层节点神经元个数;n2为输入层节点神经元个数;n3为输出层节点神经元个数;a为[1,10]之间的调整值(整数)。本文先以经验公式作为隐含层节点数的初始值然后经过大量实验不断调整节点个数和延迟参数选取最优神经元结构。隐层训练函数使用运算时间较短和收敛速度较快的LM算法。

1.2 经验模态分解

经验模态分解是在傅里叶变换和小波变换的基础上发展起来的一种新型的信号预处理的方法,它不需要任何基函数就可以自适应的将复杂的无规律的信号分解为特征单一的不同频率的imf分量和一个趋势项,各个imf分量可以看作是影响原始信号的不同因数,趋势项则反映了原始信号的整体变化趋势[12]。

1.3 EMD-NAR组合模型的建立

EMD-NAR模型的算法流程图如图3所示。

首先利用EMD频谱分析功能将IGS提供的电离层TEC数据进行分解变换得到不同级别不同频率的单一的子时间序列,然后对所得的各个子时间序列分别建立NAR动态神经网络模型进行预报进而重构得到最终预报值。具体步骤如下:

1)利用EMD分解将TEC时间序列x(t)分解为一系列不同级别不同频率且特征单一的imf分量,即[13]

(5)

式中:imfi为EMD分解所得到的本特征分量;n为分量总数;r(t)为趋势项余量。

2)对得到的分量和趋势项分别建立NAR动态神经网络模型进行预报,并整合所有模型的结果,得到TEC的预报值。采用IGS中心提供的观测数据作为对比值,以日平均相对精度RA和均方根误差RMSE作为评价指标。其相应的定义为

(6)

(7)

式中:Ipre,i为第i个历元的预报值;IIGS,i为第i个历元IGS中心的观测值;n为时段的历元长度。

2 实验分析

根据太阳黑子数和F10.7指数,选取IGS提供的2008年年积日第61~80天、第147~166天、第239~258天、第330~349天高纬度(85°N,120°E)、中纬度(45°N,120°E)和低纬度(5°N,120°E)数据作为电离层平静期样本序列;选取2013年年积日第146~165天和第225~244天高纬度(85°N,125°E)、中纬度(45°N,120°E)和低纬度(5°N,120°E)的数据建立电离层活跃期TEC时间序列。将所选TEC样本序列数据分为3个部分:60 %(所选序列前12 d)的数据作为训练集训练模型,以10 %(所选序列中间2 d)的数据作为验证集来辅助模型的构建,以30 %(所选序列后6 d)的数据作为测试数据用于评估模型的精度。

2.1 不同模型的精度分析

为了验证EMD-NAR模型的预报精度,采用单一的NAR模型、EMD-BP模型作为对比模型进行对比分析,以预测拟合电离层TEC值图形与计算误差的形式来实证其差异。

图4为EMD-NAR模型和单一的NAR模型的预报结果对比图。其中横坐标为预测历元的个数,以时段长度2 h为单位;纵坐标表示TEC值,单位为TUCu的个数,1个TUCu等于“1016个电子/平方米”。可以看出相较于单一模型EMD-NAR模型的预报结果能更好地反映电离层TEC值的变化情况,预测性能更好,且预报结果IGS中心提供的TEC值更为接近,误差更小。表1从整体上反映了单一NAR模型和EMD-NAR模型的残差误差的分布情况。单一NAR模型预报6 d的平均残差小于1个TECu的约占66.7 %,而组合模型约为81.9 %,残差大于3个TECu的单一NAR模型约占8.3 %,而EMD-NAR模型仅为5.5 %。

预报天数/dNAR模型/EMD-NAR模型(以TECu个数计)Δ<1 1≤Δ<22≤Δ<3Δ≥3158.3/75.016.7/8.38.3/16.716.7/0.0266.7/91.68.3/8.316.7/0.08.3/0.0358.3/83.333.3/0.08.3/8.30.0/8.3475.0/75.08.3/8.38.3/8.38.3/8.3575.0/75.00.0/16.716.7/0.08.3/8.3666.7/91.616.7/0.08.3/0.08.3/8.3

图5为EMD-NAR模型和EMD-BP模型的预报结果对比图。其中横坐标为预测历元的个数,以时段长度2 h为单位;纵坐标表示TEC值,单位为TECu的个数。可以明显看出相较于EMD-BP模型EMD-NAR模型具有更好的预报精度。统计不同时段的预报残差得到表2。可以看出EMD-NAR模型的预报精度数学性能指标方面也明显优于EMD-BP模型。

预报天数/dEMD-BP模型/EMD-NAR模型(以TECu个数计)Δ<1 1≤Δ<22≤Δ<3Δ≥3152.8/83.316.7/8.316.7/5.613.8/2.8261.1/75.019.4/16.711.1/8.38.3/0.0358.3/77.816.7/11.18.3/5.616.7/5.6463.9/83.38.3/8.316.7/2.811.1/5.6555.6/80.619.5/16.713.8/0.011.1/2.8666.7/75.016.7/16.78.3/5.68.3/2.8

计算各个时段的相对精度和RMSE得到表3,可以看出在相对精度和RMSE方面,EMD-NAR模型明显优于单一NAR模型和EMD-BP模型,从数学性能指标方面验证了上述结果。

表3 不同模型的RMSE和RA

2.2 EMD-NAR模型在不同环境下的精度分析

图6对EMD-NAR模型在平静期和活跃期高、中、低3个不同纬度的预报结果进行了统计,其中横坐标为预测历元的个数,以时段长度2 h为单位;纵坐标表示TEC值,单位为TECu的个数。可以看出,在电离层平静期与活跃期利用EMD-NAR动态神经网络模型预测得到的TEC值与实际值相比在高、中和低纬度地区都能较好地反映TEC的变化情况。 且在平静期有更好的拟合效果。

由表4的残差统计结果得出,电离层平静期和活跃期的预报残差在1个TECu的分别占71.2 %和68.5 %,预报残差大于3个TECu的分别为9.3 %和12.5 %。可以看出:总体来说EMD-NAR动态神经网络模型具有较高的预报精度,预报结果也比较理想;但是活跃期的电离层的不稳定性导致在电离层平静期的预报结果要明显优于电离层活跃期的预报结果。

预报天数/d平静期活跃期Δ<1 1≤Δ<22≤Δ<3Δ≥3Δ<11≤Δ<22≤Δ<3Δ≥3175.011.15.68.363.913.98.313.9269.413.95.611.166.711.111.111.1366.716.711.15.669.411.15.613.9472.213.95.68.372.25.65.616.7575.08.35.611.166.78.38.311.1669.411.18.311.172.211.111.18.3

表5和表6对电离层平静期、活跃期在不同经度的相对精度和均方根误差进行了统计;从另一个角度验证了图6的结论。可以看出;EMD-NAR动态神经网络模型在平静期和活跃期的不同经纬度预报值都有较高相对精度和较优的均方根误差;预报结果的相对精度和均方根误差在不同纬度地区略有差异,相对精度在低纬度地区最优,而均方根误差则在高纬度地区最优,这主要是由TEC的含量在不同纬度有很大不同所导致的。

表5 电离层平静期预测值的RMSE和RA

3 结束语

本文首先对比了单一NAR模型和EMD-NAR模型在相同环境下的预报性能,验证了组合模型的优越性,然后经过大量实验对EMD-NAR模型在不同环境下(不同活跃期、不同纬度)的预报性能做出如下小结:

1)相较于单一NAR模型,EMD-NAR模型,预报效果和精度都有很好的提升,与实际数据吻合更好;

2)与一般神经网络相比,动态神经网络的拟合和预测性能更优;

3)EMD-NAR动态神经网络模型能很好地反映电离层TEC的变化特性,平静期和活跃期的预测平均相对精度分别为94 %和88.3 %,预报残差小于1个TECu的分别占71 %和68.5 %,小于3个TECu的分别占90.3 %和87.5 %,活跃期的电离层的不稳定性导致在电离层平静期的预报结果要明显优于电离层活跃期的预报结果。

猜你喜欢
电离层个数神经元
怎样数出小正方体的个数
AI讲座:神经网络的空间对应
怎样数出小木块的个数
仿生芯片可再现生物神经元行为
最强大脑
怎样数出小正方体的个数
GPS实时三频电离层修正方法及精度分析
这个神经元负责改变我们的习惯
IGS组织的全球电离层数据分析与比较
研究人员精确定位控制饮酒的神经元