趋势外推与ARIMA法在卫生费用组合预测建模中的应用*

2015-01-27 10:31张利平李望晨
中国卫生统计 2015年3期
关键词:差分预测值趋势

张利平 李望晨△

趋势外推与ARIMA法在卫生费用组合预测建模中的应用*

张利平1,2,3李望晨1,2,3△

目的 对卫生费用各指标进行组合预测模型设计和实证研究。方法 山东省卫生费用资料用差分和趋势外推法优选曲线模型,以三和法识别参数;序列二阶差分平稳后对ARIMA模型定阶、参数识别;分别进行拟合与外推预测建模研究。引入线性加权组合方法,动态计算权重,修正预测值。结果 卫生费用资料均呈渐进趋势变化,建模方案可行、拟合效果优良、权重计算合理,组合模型可改进预测效果。结论 趋势外推法、ARIMA法及组合方法对渐进趋势性时序资料的预测建模问题有代表性。

时间序列 组合模型 卫生费用 预测

卫生总费用由政府、社会和个人支出构成[1],是用于医疗卫生服务的资金总额,它体现了卫生资金筹集、分配和使用效果。有必要通过组合模型设计,拟合各费用动态变化和历史演变规律来推测未来情况。

数据来源

以山东省为例,卫生总费用(X1)、政府支出(X2)、社会支出(X3)、个人支出(X4)各指标随时间有稳定、平滑、渐进延续的特点,可考虑时间序列方法建立模型进行拟合与外推预测。山东省1998-2011年资料见表1。

方法与原理

1.趋势外推法

参数识别用三和法,截取近期数据y0,y1,…,yn-1;yn,…,y2n-1;y2n,…,y3n-1等分三段求和,标记∑1,∑2,∑3。如yt=k+abt参数公式:b=[(∑3-∑2)/(∑2-∑1)]1/n;a=(∑2-∑1)(b-1)/(bn-1)2;k=(∑1∑3-(∑2)2)/(∑1+∑3-2∑2)/n。同理,取对数lny0,…,lnyn-1;lnyn,…,lny2n-1;lny2n,…,lny3n-1,或取倒数1/y0,…,1/yn-1;1/yn,…,1/y2n-1;1/y2n,…,1/y3n-1,等分三段求和,可推导其余两种曲线的参数公式。根据前t个数据建立模型后,带入t+1可外推预测yt+1。

2.ARIMA法

ARIMA(p,d,q)即求和自回归移动平均模型,广泛用于数量经济、卫生领域时间序列建模问题[2]。若记原始序列{xt},残差序列{εt},则表达式:

其中▽d=(1-B)d,Φ(B)=(1-φ1B-…-φpBp),Θ(B)=(1-θ1B-…-θqBq),φi,θj,为模型参数。Bkxt=xt-k和▽dxt=(1-B)dxt为差分算子,d为差分次数,i=1,2,…,p;j=1,2,…,q。

基本步骤包括平稳性与白噪声检验、模型定阶、参数估计和检验应用,过程复杂可借助SAS软件编程。纯随机序列无建模意义,非平稳序列不能直接建模,经低阶差分消除趋势性,季节步长差分可消除周期性。时序图、自相关图和偏自相关图有助于随机性、趋势性和平稳性分析。自相关系数ACFq阶截尾则拟合MA(q)模型,偏自相关系数PACFp阶截尾则拟合AR(p)模型,图形定阶随意性大,一般根据AIC、SBC或BIC信息量择优配置。由最小二乘法估计参数,由{εt}纯随机性检验判断信息是否提取充分。

结果分析

1.趋势外推预测

对X1数据根据差分法匹配最优曲线模型,预处理后计算增长特征,结果见表2。

用三和法分别识别模型参数,X1~X4指标均截取2000年-2011年数据,令n=4,计算得k1=135.905,a1=136.32,b1=1.24768;k2=22.30189,a2=13.7459,b2=1.3636;k3=26.3349,a3=45.0926,b3=1.2690;k4=40.75953,a4=121.842,b4=1.15121。各指标表达式、预测值和拟合值见表3~4。

2.ARIMA预测模型

将各指标数据纳入建模过程,借助SAS软件实现。序列有明显趋势性和短期相关性,无季节波动性,经二阶差分消除趋势。ACF拖尾、PACF一阶截尾,确定AR(1)模型(1-0.43195B)(1-B)2xt=εt,AIC=135.35,SBC=136.32。经检验参数有统计意义(P=0.0278,P<0.0001),{εt}白噪声检验,延迟6阶LB检验,P=0.6589>0.05,说明模型拟合好。外推2012年预测值2005。

分别对X2~X4指标进行分析和建模。原始序列作白噪声检验,均有短期自相关性,二阶差分后化为平稳序列,建立政府支出模型(1-B)(1-B)2xt=εt,AIC=79.41,SBC=79.90,参数有统计学意义(P=0.001)。残差自相关性检验,延迟6阶LB统计量为4.90,自由度5,P=0.4282>0.05,模型对信息提取充分,残差为白噪声序列,预测值为548。同理,社会支出模型(1+0.25191B)(1-B)2xt=εt,预测值725;个人支出模型(1-0.77926B+B2)(1-B)2xt=εt,预测值634。ARIMA模型对X1~X4依次拟合情况见图1。

模型拟合序列数据放在SAS程序work文件夹,模型表达式、预测值和拟合值见表5~6。

3.加权组合预测

趋势外推模型和ARIMA模型拟合数据分别与原始数据比较后计算误差,将误差平方和倒数作为权重,归一化后对原预测值加权求和,计算组合预测值,见表7。

讨 论

趋势外推法就是根据曲线差分性质与序列差分特征计算结合的曲线优选技术,ARIMA法在随机时间序列分析领域有普适代表性。山东省卫生费用数据随时间变化呈渐进、平稳、递增趋势,适于建立拟合模型。加权组合思想以拟合残差最小为原则,动态计算权重,对各种预测值加权合成计算,最终修正预测值,对于改进拟合预测精度有借鉴意义。

在卫生事业管理领域,如卫生资源供求、人口出生率、医疗水平改善、卫生费用投入、卫生机构收入和门诊人次等许多事物受复杂因素影响而难以筛选量化,但时序资料获取方便、鉴于多存在较平缓趋势和某种延续性规律,为数理模型引入提供了适宜空间。组合建模方法旨在借助数据计算深度提取拟合信息,使预测更合实际,有助于管理工作者在资深经验、专业对策基础上注重数理技术应用理念,主客观结合制定更全面结论,促进决策实效性。

[1]徐国祥.统计预测与决策.上海:上海财经大学出版社,2012,8:50-136.

[2]王燕.应用时间序列分析.北京:中国人民大学出版社,2012,12:120-177.

[3]王玖,韩春蕾,栾奕昭.组合预测在医院门诊量预测中的应用.中国卫生统计,2012,29(6):881-883.

(责任编辑:郭海强)

*资助项目:健康山东重大社会风险预测与治理协同创新中心项目(XT1401001-1401003);山东统计局项目(2014-184);潍坊市科技局项目(201301079);教育部人文社科项目(13YJAZH094)

1.潍坊医学院公共卫生学院(261053)

2.健康领域社会风险预测治理协同创新中心

3.健康山东重大社会风险与治理协同创新中心

△通信作者:李望晨

猜你喜欢
差分预测值趋势
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
数列与差分
趋势
AI讲座:ML的分类方法
初秋唇妆趋势
SPINEXPO™2017春夏流行趋势
趋势