SARIMA模型预测山东省手足口病发病趋势*

2013-09-07 09:02王显军姜宝法丁淑军王连森孙大鹏裴耀文王建醒逄博
中国卫生统计 2013年5期
关键词:季节性口病差分

刘 涛 王显军 姜宝法 丁淑军 王连森 孙大鹏 裴耀文 林 艺 王建醒 逄博

SARIMA模型预测山东省手足口病发病趋势*

刘 涛1,2王显军3△姜宝法1△丁淑军3王连森3孙大鹏3裴耀文3林 艺3王建醒3逄博3

目的 建立山东省手足口病发病的SARIMA模型并进行预测。方法 应用SPSS17.0软件对山东省2005年1月至2011年12月手足口病月发病率进行SARIMA模型建模拟合。结果 SARIMA(1,0,1)(0,1,0)12能较好地拟合既往时间段的发病率,对2011年各月的预测值符合山东省手足口病实际发病率变动趋势,对2012年手足口病发病率进行了预测。结论 SARIMA模型能较好地模拟手足口病发病率在时间序列上的变动趋势,用其对未来的发病率进行预测,可为手足口病防治工作提供参考。

手足口病 SARIMA模型 时间序列分析

*:国家重大科学研究计划资助(2012CB955502);山东省2009年科技发展计划资助攻关项目(2009GG10002055)

1.山东大学公共卫生学院流行病与卫生统计研究所(250012)

2.烟台市疾病预防控制中心

3.山东省疾病预防控制中心

△通信作者:姜宝法,Email:bjiang@sdu.edu.cn;王显军,E-mail:xjwang62@163.com

手足口病(hand-foot-mouth disease,HFMD)是由多种肠道病毒引起的常见传染病,以婴幼儿发病为主。大多数患者症状轻微,以发热和手、足、口腔等部位的皮疹或疱疹为主要特征。少数患者可并发无菌性脑膜炎、脑炎、急性弛缓性麻痹、呼吸道感染和心肌炎等,个别重症患儿病情进展快,易发生死亡[1]。山东省是手足口病的多发省份,2000年、2003年、2005年、2007年烟台、泰安、济宁、临沂等市的局部地区发生爆发流行[2]。由于全国手足口病的发病形式相当严峻,2008年5月2日卫生部将其列入《中华人民共和国传染病防治法》规定的丙类传染病[3]。本次研究利用2005-2011年山东省手足口病发病资料,采用季节性求和自回归滑动平均模型法(seasonal auto regressive integrated moving average,SARIMA)建立山东省手足口病发病率预测模型,为有关部门防制手足口病提供依据。

资料和方法

1.资料的来源

数据为2005-2011年山东省手足口病报告病例数,资料来自于“国家疾病监测信息报告管理系统”。人口资料来自于2006-2011年山东省统计年鉴。

2.方法

利用SPSS17.0软件中的ARIMA模型分析方法,对山东省近6年的手足口月发病率数据进行处理和分析。首先利用2005年1月-2011年12月的发病率数据进行建模,用2011年1月到12月的数据对模型进行回顾性验证,最后再用模型对2012年的月发病率进行预测。

3.ARIMA模型构建

求和自回归滑动平均模型法(SARIMA)是将时间序列视为一组依赖于时间(t)的随机变量,这组随机变量所具有的自相关性表征了预测对象发展的延续性,而这种自相关性一旦被相应的数学模型描述出来,就可以从时间序列的过去值及现在值预测其未来的值[4]。ARIMA模型综合考虑了序列的趋势变化、周期变化及随机干扰。本研究中采用的模型是考虑季节变化的季节性ARIMA模型(SARIMA),其结构为(p,d,q)(P,D,Q),其中的p、q分别为自回归和移动平均阶数,d为非季节差分次数,P、Q分别为季节性自回归和移动平均阶数,D为季节性差分次数[5]。

SARIMA模型建模的基本步骤可以分为四步[6]:①序列预处理:SARIMA模型的应用需要时间序列符合平稳性和非白噪声的要求;②模型的识别:主要根据自相关系数(ACF)和偏相关函数(PACF)图的特征,提出几种可能的模型作下一步分析;③模型参数估计和模型诊断:对提出的模型进行参数估计和诊断,如模型不合适,则回到第二阶段,重新选定模型;④预测应用:2005-2011年的数据用于建立模型,利用2011年的数据用于验证模型的拟合效果[7],并预测2012年手足口病的发病率。

结 果

1.山东省手足口病发病趋势分析

绘制2005年1月-2011年12月山东省手足口病发病率的时间序列图,如图1。从图中可知,手足口病发病率有逐年上升趋势,并且每年的5月至7月份是发病高峰期,存在明显的季节性。

2.季节性ARIMA模型的建立

(1)序列平稳性

一个平稳的随机过程应符合以下要求:均数不随时间变化;方差不随时间变化;自相关系数只与时间间隔有关,而与所处的时间无关[8]。如图1所示,从2007年开始序列的波动幅度加大,并且从整体上看山东省手足口病发病率呈上升趋势,同时序列呈现出一定的季节周期性,说明序列是非平稳序列。故需要对序列进行自然对数转换和差分,转换成为平稳的时间序列。

图1 2005-2011年山东省手足口病逐月发病率时序图

(2)模型的识别

为了使时间序列平稳,首先进行自然对数转换,其次进行差分。差分分为一般差分和季节性差分。由图1可知,该序列发病率的季节性明显,需进行一阶季节性差分。差分后,该序列的ACF图、PACF图(图2),可认为该时间序列通过一阶季节性差分后达到平稳序列。此时,可以构建SARIMA模型。

(3)模型参数估计和模型诊断

SARIMA(p,d,q)(P,D,Q)12中,根据差分结果,d=0,D=1。由ACF图可知,q=0,由PACF 图可知,p=1。季节模型的参数P、Q判断较为困难,但根据文献,参数超过二阶的情况很少见[8],可以分别取0、1、2由低阶到高阶逐个试验,结合Ljung-Box方法检验残差白噪声,淘汰非白噪声模型,计算剩余模型的BIC值,挑选其中BIC最小的模型作为最佳模型。经过筛选符合条件的SARIMA模型有九个,见表1,最终确定最佳模型 SARIMA(1,0,1)(0,1,0)12。该模型经过Ljung-Box方法检验残差白噪声,得到统计量为14.909,P值为 0.531(>0.05),残差的 ACF图(图3)、PACF图(图3)、Q-Q图(图4)如下,残差为白噪声;模型中的参数检验具有意义(表2)。用该模型预测2011年山东省手足口病各月发病率结果如表3所示,2011年各月的实际发病率虽然与预测值不完全一样,但各月实测值都落入了预测值的可信区间范围。可以看出模型预测值的动态趋势与实际情况基本一致,模型对未来的情况进行了很好的跟踪和预测。

图2 进行自然对数转换和一次季节差分后ACF图和PACF图

表1 残差检验符合条件的各模型的BIC值

图3 残差ACF和PACF图

图4 残差Q-Q图

表2 山东省手足口病发病率模型参数估计

(4)预测应用

利用 ARIMA(1,0,1)(0,1,0)12模型,对 2005 年1月到2011年12月全省逐月发病率进行拟合。结果如图5,可见实测值与拟合值重合程度高,显示模型拟合较好。进一步用该模型对2012年各月的发病率进行预测,结果见表4。

表3 2011年1-12月山东省手足口病发病率与采用ARIMA模型预测发病率比较(1/10万)

图5 山东省手足口病各月发病率ARIMA模型拟合预测图

表4 2012年山东省手足口病各月发病率(1/10万)预测值

讨 论

1.手足口病预测的意义

手足口病传播速度快,传染性强,尤其是对5岁以下儿童危害严重,至今尚无疫苗预防,亦无特异性治疗方法。目前,防治手足口病主要采取早预防、早发现、早诊断、早治疗手段。由于过度的预防会导致卫生资源的浪费和不恰当的使用。通过模型的预测可以了解疾病的发展态势,提早采取措施,有针对性地做好疫点、疫区的卫生处理和传染源管理工作,遏制疫情蔓延。此外,手足口病多为散发,发病率按照既往的变化规律(季节性)发生变化。如果实际发病率在预测值95%可信限范围内波动,表明当月疫情基本正常;如果超出预测值95%可信限范围,表明当月疫情已不同于以往流行规律,应警惕传染病暴发或流行的可能[7]。该研究中2012年山东省1-4月的发病率实际值均落在预测值的95%置信区间内,说明2012年山东省前四个月的手足口病的发病率基本正常。通过SARIMA模型发现,2012年夏季手足口病的发病率要高于2011年,这应该引起有关部门的注意。

2.SARIMA模型在手足口病研究中的应用

用于手足口病预测的模型主要包括回归分析预测模型和时间序列分析预测模型两类。SARIMA模型是目前最常用的时间序列预测方法,已被广泛应用到预防医学各个领域[7,9-10]。手足口病的发病原因比较复杂,它与人的自身免疫力、病原、相关社会保健水平、人们的卫生习惯及预防意识、环境条件等因素有关[11-12]。回归分析预测模型就是通过分析影响手足口病疾病发生的各种因素,对数据进行回归拟合;由于自然和社会环境许多未知因素难以获得,使其存在局限性。时间序列分析克服了因果回归分析法中预测对象的影响因素难以掌握和数据资料不易得到的难题,利用任何事物的发展都具有一定惯性(即延续性)的原理,建立时间序列模型,以达到预测未来的目的[13]。

3.SARIMA应用注意事项

SARIMA的应用前提是时间序列的平稳性,实际工作中数据往往是非平稳序列,需对序列进行预处理,使之达到平稳的要求;如果模型中含有季节因素,则至少应有7或8个季节周期的数据对季节参数进行估计。若序列太短,则可靠性较差;如果所研究对象的惯性趋势发生了很大的改变(例如对主要传染病采取了新的防治措施,或有新的传染病传入),则需要积累新的数据对模型进行修正甚至重新拟合[7]。本研究中2011年预测值与真实值之间相对误差较大,原因是考虑到应用时间序列SARIMA模型需要数据个数的要求,但是2008年以前,手足口病未纳入法定传染病,导致发病数目上报数量与实际数量有太大出入。若是排除2005、2006、2007年的发病率,将无法应用该模型。这在一定程度上影响了预测精度。但是随着时间的进行,逐步增加可靠、真实病例数收集,这可以将前期不太准确的数据摒弃,进而完善SARIMA模型,使预测值与真实值相贴近。

1.卫生部.手足口病预防控制指南 (2009版).全科医学临床与教育,2010,8(2):125 -127.

2.王连森,毕振强,房玉英,等.2008年山东省手足口病流行病学分析.山东医药,2009,49(019):45 -47.

3.卫生部.手足口病预防控制指南(2008年版).中国乡村医药,2009(S1).

4.徐国祥.统计预测和决策.上海:上海财经大学出版社,1998:150-177.

5.潘浩,郑扬,吴寰,等.ARIMA模型预测上海市手足口病发病趋势.预防医学情报杂志,2011,27(6):408 -411.

6.张文彤.SPSS统计分析高级教程.高等教育出版社,2004:250-289.

7.吴家兵,叶临湘,尤尔科.ARIMA模型在传染病发病率预测中的应用.数理医药学杂志,2007,20(1):90 -92.

8.温亮,徐德忠,林明和,等.应用时间序列模型预测疟区疟疾发病率.第四军医大学学报,2004,25(6):507 -510.

9.李廷杰,陈秀山.应用时间序列统计方法分析广东省1984-1993年乙型脑炎季节性分布特性.中华流行病学杂志,1998,19(2):103-106.

10.丁亚兴,张之伦,朱向军.自回归综合移动平均模型对天津市甲型肝炎发病预测.疾病监测,2008,23(5):326 -328.

11.张晓云,张之伦.气象要素对肠道传染病的影响及预报.气象,2002,28(005):53-55.

12.周艳丽,徐文彩,马海艳.北京市东城区细菌性痢疾与气象因素的时间序列分析.疾病监测,2009,24(9):697 -700.

13.钟朝晖,刘达伟,张燕.重庆市主城区人口死亡率的时间序列分析.中国公共卫生,2003,19(7):796 -798.

Prediction of Hand-foot-mouth Disease Incidence Using SARI-MA Model in Shandong Province

Liu Tao,Wang Xianjun,Jiang Baofa,el al.Department of Epidemiology and Biostatistics,School of Public Health,Shandong University(250012),Jinan

ObjectiveTo establish a model to predict the incidence rate of hand-foot-mouth disease in Shandong Province.Methods

The SARIMA model for monthly hand-foot-mouth incidence rate from January 2005 to December 2011 in Shandong Province was established by SPSS 17.0.ResultsSARIMA(1,0,1)(0,1,0)12fitted very well with the incidence in the past period of time.The predicted incidence rates from January to December 2011 were accorded with the actual incidence trend of change in Shandong Province.ConclusionARIMA model could simulate a hand-foot-mouth disease incidence in time series change trend very well,and predict incidence and provide reference for the future as handfoot-mouth disease prevention and control work.

Hand-foot-mouth disease;SARIMA model;Time series analysis

(责任编辑:郭海强)

猜你喜欢
季节性口病差分
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
粕类季节性规律:豆粕篇
数列与差分
手足口病那些事
警惕手足口病
季节性需求放缓 钾肥价格下行
蔬菜价格呈季节性回落
远离季节性过敏
肠道病毒71型感染所致危重症手足口病的诊治分析