一种线性/非线性自回归模型及其在建模和预测中的应用

2013-03-13 01:33马家欣许飞云

东南大学学报（自然科学版） 2013年3期

马家欣许飞云黄仁

(东南大学机械工程学院，南京211189)

时间序列分析是现代系统辨识的重要方法之一，它在缺乏明确或者完全的系统输入与输出因果关系的情况下，将白噪声看作系统输入，从数理统计的角度揭示因果关系，最终求得系统的等价模型.该方法在各个领域都得到了广泛的应用［1-4］.

ARMA 模型(包括AR 模型和MA 模型)是时序方法中最基本的时序模型，然而，它是在线性回归模型的基础上引申发展起来的，很难模拟工程实际中的非线性现象.而经典的非线性时间序列模型，包括门限自回归模型、双线性模型、指数自回归模型等，一般都是在特定的工程背景下提出的，通用性不够.因此亟须提出一种适用于线性/非线性系统的时序模型.GNAR 模型的提出和应用，在形式上统一了不同背景下提出的非线性时序模型的表达式，并有机结合了线性模型［5-7］.另一方面，尽可能地利用更多的已知信息，获取更多的系统特性，可进一步提高建模精度.因此，在经典时序模型的基础上，把影响系统输出的已知相关数据作为系统输入，可得到带有外部输入的时序模型，如ARX，ARMAX 等模型.这些模型不仅在理论上得到了验证，在工程实际中也得到了广泛应用［8-11］.本文针对系统输入部分已知的特点，在GNAR 模型基础上提出了GNARX 模型，给出了模型的参数估计和结构选取方法，并将该模型应用于仿真和实际数据，效果优于其他模型.

1 GNARX 模型表达式

GNAR 模型建模时，认为系统输入是零均值的白噪声.如果系统已知单个输入，记作序列{ut}，系统的输出序列记作{wt}，白噪声记作{at}，那么GNAR 模型就变形为单输入的GNARX 模型.

对于单输入系统，设t 时刻输出值为wt，表示为函数f 的表达式，即

式中，f(·)为任意一般线性/非线性函数;wt－i为t－i 时刻的系统输出观测值，i =1，2，…;ut－τu－i为t－τu－i 时刻的系统输入，i =1，2，…;at－i为t－i 时刻的白噪声，i=1，2，…;τu为系统输入ut的延迟.

对于一般线性平稳系统，式(1)中函数f 表示ARMAX 模型;而当系统表现出非线性、非平稳特征时，由Weierstrass 逼近原理［12］知，可用多项式逼近式(1)中的f 函数:

式中，α1，α2，…，β1，β2，…，λ1，λ2，…是模型参数.

假设式(2)描述的系统具有零初始状态(即wt=0，t≤0)，且系统在初始时刻之前没有输入(即ut=0，t≤0).实际建模中，模型阶次p 取有限值，令xt，i表示式(2)中的各i 阶项，xt，i，1(i=1，2，…，p)表示i 阶项xt，i中的1 次项，即

则系统输出wt可写成如下形式:

式中，θ(i1)，θ(i1，i2)，…为模型参数;xt，i，1(j)为向量xt，i，1中的第j 个元素;nw，j(j =1，2，…，p)为输出{wt}各阶项的记忆步长;nu，j(j =1，2，…，p)为输入{ut}各阶项的记忆步长.该模型简记为GNARX(p;τu;nw，1，nw，2，…，nw，p;nu，1，nu，2，…，nu，p).

当系统具有双输入{ut}，{vt}时，把式(4)推广至双输入的GNARX 模型，简记为GNARX(p;

式中，nv，j(j =1，2，…，p)为输入{vt}各阶项的记忆步长;τv为系统输入{vt}的延迟.

同理，式(6)可推广到多输入系统，不再赘述.

2 GNARX 模型的参数估计与结构选取

GNARX 模型的参数估计用最小二乘法很容易求得.以式(4)所示的单输入GNARX 模型为例，在时刻t，p 阶项记作xt，p，是一维向量形式.求取过程中用xt，p，i(i=1，2，…，p)表示p 阶项xt，p中的i 次项，也是一维向量，其中xt，p，i(j)是标量，表示向量xt，p，i中的第j 个元素.

式中，mpi=Cinw，p+nw，p+nw，p+i－1(i=1，2，…，p).

令

记

于是，t 时刻到t+k 时刻的方程式写成

θ 参数最小二乘法估计为

其中

根据式(9)即可对单输入GNARX 模型进行参数估计.同理，可获得双输入、多输入模型的参数估计方法.

GNARX 模型结构的辨识，包括模型阶次p 的确定和记忆长度的确定，这直接影响着模型的建模性能和预测性能及模型的复杂程度，同时也关系到计算速度、预报实时性等问题.

对于GNARX 模型，定义单输入模型i 阶记忆步长si=nw，i+nu，i(i=1，2，…，p)，双输入模型i 阶记忆步长si=nw，i+nu，i+nv，i(i =1，2，…，p)，多输入模型i 阶记忆步长可依此类推得到.则i 阶参数量ri为

式中，i=1，2，…，p.

则GNARX 模型参数数量为修正AIC 准则函数［6］如下所示:

式中，α，β，γ 为重要度权系数;σ2m为建模误差方差;σ2f为预测误差方差;N 为数据长度.

式(10)中，建模误差σ2m的存在，保证了模型的建模能力;引入预测误差σ2f，可以防止模型的过拟合;而模型参数数量R 的选取则考虑了模型复杂程度对AIC 值的影响，并影响最终模型选取.按信息准则，通常取AIC 值最小处对应的模型为适用模型.

模型结构的最终确定，需要综合考虑模型的建模能力、预测能力和模型复杂程度等因素.在具体建模过程中，可根据现场要求的不同，调整式(10)中的重要度权系数，来满足实际建模需求.如模型用于滤波，则可增加建模重要度权系数α;若模型以预报为主，则可以增加预测重要度权系数β;而当现场侧重于建模实时性时，则可以增加模型复杂重要度权系数γ.

3 GNARX 模型的建模和预测应用

GNARX 模型适用范围广，对线性和非线性数据有着良好的建模预测能力.下文用GNARX 模型对仿真数据和实际数据进行建模和预测，并与其他模型预测效果进行对比.

为比较建模预测效果，定义如下衡量指标:建模均方误差

预测均方误差

建模平均绝对百分比误差

预测平均绝对百分比误差

式中，yi为模型输出真值;^为模型输出估计值;Nm为用于建模的数据长度;Nf为用于预测的数据长度.

3.1 对仿真数据的建模和预测

仿真数据模型具体形式如下:

ARX 模型

ARMAX 模型

NLARX 模型

式中，at为白噪声，服从正态分布N(0，0.1);ut－i(i=1，2，3，…)为系统输入，服从平均分布U(0，1);xt－i(i=0，1，2，…)为系统输出;F(·)取Matlab 中S 形网络非线性估计函数，单元数10，S 形函数表达式为f(z)=1/(1 +exp(－z)).

仿真数据选用前，先对{xt}序列进行归一化处理，再舍去前50 个过渡区数据，取中间250 个数据用于建模，后100 个数据用于预测.分别用AR 模型、GNAR 模型、ARX 模型、BP 网络和GNARX 模型对上述各仿真数据进行建模预测.其中时序模型是在合适的模型结构选取范围内选取的，并用式(10)所示修正AIC 判断，重要度权系数尝试选取α=1，β=1，γ=1，模型具体选取范围见表1.

表1 针对不同数据建模时各模型结构的选取范围

1)仅以建模预测数据xt作为网络的输入，输入样本数据重合度记作r，输入层节点数记作mi，网络简记为BP1(mi;mh;mo;r).

2)数据xt，ut同时作为网络的输入，xt输入维数为mx，ut输入维数为mu，延迟为τu，输入数据xt的重合度记作r，此时输入层节点数为mx+mu，网络简记为BP2(mx;mu，τu;mh;mo;r).

其中数据重合度针对输入样本{xt}而言，设第1 组输入数据为{xt，xt－1，…，xt－mx}，第2 组输入数据为{xt－k，xt－k－1，…，xt－k－mx}，把k 记作输入样本{xt}的平移量，则数据重合度定义为

网络训练时，最大迭代次数设为1.0 ×104，目标误差为1.0 ×10－3，在一定范围内改变网络待定系数(如表中mi，mh和r 等)，最终求取相对较优的网络模型.

针对上述3 组仿真数据的建模预测，各模型结构选取结果见表2，表中还给出了各模型建模预测的各项误差指标.通过对比建模预测效果可看出，GNARX 模型建模预测误差最小，其预测效果见图1～图3.

3.2 对振动位移采样电流数据的建模和预测

振动位移采样电流数据取自文献［4］.用GNARX 模型对振动位移采样电流数据(共150个)建模并预测时，首先对振动位移{x1t}和动态切削力{x2t}分别进行归一化处理，然后对{x1t}取前120 个数据用于建模，后30 个数据用于预测.因为振动位移与动态切削力存在一定关系，那么对应的采样电流数据也必然存在某种联系，所以本文用动态切削力采样电流数据{x2t}作为GNARX 模型的输入.各模型选取范围见表1，模型选取结果及建模预测误差列于表3中(α =1，β =1，γ =1)，预效果见图4.

通过分析GNARX 模型应用结果可知:

1)在明确系统输入的情况下，ARX 和GNARX 模型比AR 和GNAR 模型更为精确，建模预测效果更好.

2)GNARX 模型应用于仿真数据(包括线性和非线性模型数据)，其建模和预测精度明显高于其他模型，体现了GNARX 模型良好的建模预测能力.

表2 各模型对仿真数据建模预测的误差对比

图1 GNARX 模型对ARX 数据的预测效果

图2 GNARX 模型对ARMAX 数据的预测效果

图3 GNARX 模型对NLARX 数据的预测效果

表3 各模型对振动位移采样电流建模预测的误差对比

图4 GNARX 模型对振动位移采样电流数据预测效果图

3)GNARX 模型应用于振动位移采样电流数据，其建模预测效果同样优于其他模型，说明GNARX 模型适用于实际数据建模，具有工程应用可行性.

4)GNARX 模型应用于振动位移采样电流数据的优越性并不明显，这可能是模型输入选取不当所造成的，说明动态切削力和振动位移2 组数据间并没有明显的输入输出关系.

4 结语

将影响系统输入的相关数据作为外部输入，在GNAR 模型的基础上，提出了带有外部输入的线性/非线性自回归模型——GNARX 模型，并给出了其一般表达式及其最小二乘参数估计方法.运用一种综合考虑建模误差、预测误差及模型复杂度的修正AIC 准则，确定GNARX 模型结构，该准则通过改变重要度权系数来适应不同的现场需求，不断试验与修改，寻求最优模型.将该模型应用于仿真和实际数据，结果表明，GNARX 模型精度高，通用性好，无论是对ARX，ARMAX，NLARX 等模型的仿真数据，还是对实际工程数据，GNARX 模型都表现出了很好的建模预测能力，效果优于传统的时序模型及BP 网络.

由于非线性时间序列的分析与处理要比线性平稳时序复杂得多，且GNARX 模型结构相对冗长，在模型结构的确定、适用性检验等方面尚无统一的方法和成熟的理论研究，因此，该模型的理论研究和实际应用都有待进一步探讨.

References)

［1］Box G E P，Jenkins G M，Reinsel G C.Time series analysis:forecasting and control［M］.4th ed.Hoboken，USA:John Wiley ＆Sons Inc.，2008.

［2］Flores J J，Graff M，Rodriguez H.Evolutive design of ARMA and ANN models for time series forecasting［J］.Renewable Energy，2012，44:225-230.

［3］Hansen P R，Huang Z，Shek H H.Realized GARCH:a joint model for returns and realized measures of volatility［J］.Journal of Applied Econometrics，2012，27(6):877-906.

［4］杨叔子，吴雅，轩建平.时间序列分析的工程应用:下册［M］.2 版.武汉:华中科技大学出版社，2007.

［5］陈茹雯，黄仁，张志胜，等.基于数学模型的视觉测量系统图形畸变校正方法［J］.机械工程学报，2009，45(7):243-248.

Chen Ruwen，Huang Ren，Zhang Zhisheng，et al.Distortion correction method based on mathematic model in machine vision measurement system［J］.Journal of Mechanical Engineering，2009，45(7):243-248.(in Chinese)

［6］Huang Ren，Xu Feiyun，Chen Ruwen.General expression for linear and nonlinear time series models［J］.Frontiers of Mechanical Engineering in China，2009，4(1):15-24.

［7］陈茹雯，黄仁，史金飞，等.线性/非线性时间序列模型一般表达式及其工程应用［J］.东南大学学报:自然科学版，2008，38(6):1077-1080.

Chen Ruwen，Huang Ren，Shi Jinfei，et al.General expression for linear and nonlinear time series model and Its engineering application［J］.Journal of Southeast University:Natural Science Edition，2008，38(6):1077-1080.(in Chinese)

［8］Muhannad Z，Yusoff Z M，Rahiman M H F，et al.Modeling of steam distillation pot with ARX model［C］//IEEE 8th International Colloquium on Signal Processing and Its Applications.Melaka，Malaysia，2012:194-198.

［9］Sanandaji B M，Vincent T L，Wakin M B，et al.Compressive system identification of LTI and LTV ARX models［C］//50th IEEE Conference on Decision and Control and European Control Conference.Orlando，FL，USA，2011:791-798.

［10］Raniman M H F，Taib M N，Salleh Y M.Black box modeling of steam distillation essential oil extraction system using ARMAX structure［C］//International Conference on Intelligent and Advanced Systems.Kuala Lumpur，Malaysia，2007:1059-1062.

［11］Stefanoiu D，Seraficeanu C，Culita J.Identification of MIMO-ARMAX models for glycemia and sodium ions tests through Particle Swarm Optimization［C］//IEEE International Conference on Control and Automation.Christchurch，New Zealand，2009:643-650.

［12］Giardina C R，Chirlian P M.Proof of Weierstrass approximation theorem using band-limited functions［J］.Proceedings of the IEEE，1973，61(4):512.