差分整合移动平均自回归模型在医院流感样病例监测中的应用

2019-04-22 06:12李桂芹黄立勇覃凤芝
首都医科大学学报 2019年2期
关键词:北京朝阳医院单位根首都医科大学

李桂芹 黄立勇 覃凤芝

(1.首都医科大学附属北京朝阳医院疾病预防控制处, 北京 100020; 2.北京市朝阳区疾病预防控制中心流行病与地方病控制科,北京 100021; 3.厦门大学公共卫生学院, 厦门 361102)

流行性感冒(简称流感),是由流行性感冒病毒(简称流感病毒)引起的急性呼吸道传染病,是首个实行全球性监测的传染病。流感的流行期间,因流感或流感样病例导致的门诊就诊量和住院率明显上升,加重医疗卫生服务的压力,如2009年的甲型H1N1流感大流行导致约180万人感染,数十万流感样病例超额就诊[1]。目前,流感样病例监测已成为流感监测早期预警的重要方法之一[2]。首都医科大学附属北京朝阳医院作为北京市流感样病例监测的哨点医院和流感病原学监测的国家级哨点医院,每年接诊的流感样病例患者及报告的确诊流感病例数占北京市朝阳区26家哨点监测医院的比例均逐步升高。

北京市疾病预防控制中心张莉等[2]研究流感样病例和流感病原学监测间具有良好的相关性。因此,为研究适用于医院的流感样病例预测模型,有效调整医疗资源配置,做好流感防控工作,笔者选择2014至2017年首都医科大学附属北京朝阳医院流感样病例数据开展差分整合移动平均自回归模型(autoregressive integrated moving average model,ARIMA)研究。

1 资料与方法

1.1 流感样病例监测

流感样病例是指发热(腋下体温≥38 ℃),伴咳嗽或咽痛之一者。首都医科大学附属北京朝阳医院作为首批国家级流感监测哨点医院较早地开展了流感样病例监测工作,每日按照监测方案分诊室(内科门诊、急诊和小儿内科门诊、急诊以及发热门诊)、分年龄组(0~4岁、5~14岁、15~24岁、25~59岁、60岁以上)进行流感样病例数和门(急)诊就诊总数的统计,并于每日12∶00时之前报告至中国流感监测信息系统。

1.2 流感样病例监测数据选取

按日导出2014年1月12日至2017年12月24日间本院报告的流感样病例、门(急)诊就诊总数、流感样病例百分比数据,并按周进行汇总。

1.3 ARIMA模型

ARIMA模型的基本原理是将时间序列视为一组依赖于时间(t)的随机变量,其中单个序列值的出现具有不确定性,但整个序列的变化却呈现一定的规律性[3-5]。 ARIMA包含3种基本模型形式:①移动平均模型MA(q),q为计算移动平均数时包括的历史数据个数;②自回归模型AR(p),p为计算自回归时包括的历史数据个数;③差分值(d)。模型的识别就是确定这3个参数;参数估计就是确定各过程的内部系数;最后模型诊断就是判断通过前两步所建立的模型是否与实际数据相吻合。

模型构建步骤为:①用单位根检验[6](unit root test)判断前194周数据的平稳性,确定差分数(d)。ARIMA要建立在平稳序列之上,若单位根检验拒绝原假设,表明数据平稳;若单位根检验接受原假设,则通过对数据进行差分的方式使数据平稳;②模型识别与估计。根据自相关函数、偏自相关函数图、赤池信息准则(akaike information criterion,AIC)和调整决定系数[7]来识别最佳的p、q值;③模型诊断[7]。对残差进行Q检验,检验残差的自相关性,若残差无自相关,则表示模型拟合较好;④模型拟合与预测。用ARIMA模型对所分析的194周数据进行拟合,并对最后12周的流感样病例百分比进行预测。

1.4 数据分析方法

利用Excel 2013汇总流感样病例数据,并利用Eviews 9.0软件开展ARIMA模型的拟合预测。

2 结果

2.1 流感样病例监测情况

2014年1月12日至2017年12月24日,本院监测科室门(急)诊就诊总数为1 368 676例次,其中流感样病例数为126 124例(9.22%)。0~4岁为26 312例,5~14岁为26 518例,15~24岁为16 372例,25~59岁为43 441例,60岁以上为13 481例。流感阳性毒株检出率为8.80%。监测结果中5~14岁与25~59岁人群流感样病例发病数占有较高比例,分别为21.03%和34.44%。

由表1 可以看出本院报告流感病例的高峰和流感样病例的就诊高峰并不完全一致,需要更加确定的方法来预测,笔者特采用ARIMA模型来进行分析判断。

2.2 未经平稳化的时间序列

绘制2014年至2017年流感样病例(influenza-like illness, ILI)百分比的时间序列分析图(图1),可以看出ILI%在每年的年末和次年的年初有峰值,但是高峰出现的时间和持续时间并不规律。

表1 2014年至2017年首都医科大学附属北京朝阳医院流感报告及药物储备情况Tab.1 Influenza cases report and drug reserve of Beijing Chaoyang Hospital, Capital Medical University during 2014 to 2017

图1 2014年至2017年首都医科大学附属北京朝阳医院ILI的时间序列图Fig.1 Time series of ILI% of Beijing Chaoyang Hospital, Capital Medical University during 2014 to 2017ILI:influenza-like illness.

2.3 单位根检验确定数据平稳性

用单位根检验分析序列的平稳性,结果显示,单位根拒绝原假设,即序列平稳,确定序列差分值d为0(表2)。

表2 单位根检验结果Tab.2 Unit root test results

2.4 模型识别与估计,确定p、q

偏相关函数和自相关函数如图2所示,偏相关函数在P=2或者P=4时截尾,而自相关函数不截尾,由此建立ARIMA(2,0,0)和ARIMA(4,0,0)模型,根据AIC值和调整决定系数(表3)选择两个模型的最优值,结果显示,在将P值增大到4时,AIC值几乎没有变化,并且ARIMA(2,0,0)模型的调整决定系数较ARIMA(4,0,0)的大,由此选择ARIMA(2,0,0)建模。模型可以写成如下公式:yt=8.25 + 1.13yt-1-0.23yt-2+εt。

根据模型计算表3所示,该模型的一阶滞后函数和二阶滞后函数的系数差异均有统计学意义。

2.5 模型检验

使用Q统计量(Q-statistics)对模型残差自相关性进行检验,残差无自相关,说明模型合适(图3)。

2.6 模型拟合与预测

图4表示用模型对数据进行拟合,结果显示模型对数据拟合效果较好,真实值与拟合值变化趋势基本没有很大差别。

图5显示,模型预测的数值比较平稳,真实值在模型预测值的95%置信区间内,但是可以注意到随着预测期数的增加,预测值95%置信区间也越大,说明预测误差逐步扩大,从2017年第48周起,真实值迅速升高,51周的真实值已高于95%置信区间上限,提示进入流感流行高峰期。

表3 ARIMA(2,0,0)模型建模结果Tab.3 ARIMA (2,0,0) model modeling results

图2 自相关函数与偏相关函数Fig.2 Autocorrelation function and partial correlation function

图3 残差自相关检验Fig.3 Residual autocorrelation testAC:actocorrelation; PAC:partial correlation.

图4 首都医科大学附属北京朝阳医院ILI%的模型拟合值与真实值对比Fig.4 Comparison of model fit values and true values of ILI% in Beijing Chaoyang Hospital, Capital Medical University ILI: influenza-like illness.

图5 2017年第41周至52周 模型预测值与真实值Fig.5 Model predictions and real values during 41 to 52 week, 2017ILI:influenza-like illness.

3 讨论

用于预测的模型有很多,包括指数平滑法、线性回归法、自回归分析、马尔可夫模型、ARIMA模型等,ARIMA模型是时间序列分析中最重要的模型之一,目前广泛应用于流感、猩红热、结核病等传染病发病率的预测[3-4,8-9]。由于流感诊断多为临床诊断病例,在高峰季节,流感的临床诊断很容易受到人为因素的影响,有时监测的流感疫情数据短期内呈现出大范围波动[10]。流感样病例的定义相对简单、客观,更能够反映出因罹患呼吸道疾病而就诊的趋势变化。此外,Zambon等[11]研究发现,在流行高峰期,流感病毒和呼吸道合胞病毒感染的ILI超过90%。因此利用流感样病例数据可以很好地预测包括流感在内的多种呼吸道传染病的流行趋势。

本研究利用2014年至2017年流感样病例数据拟合的模型中预测值与实际值在短期内较为吻合,并且可以根据ARIMA模型预测值的95%置信区间值与真实值的变化确定流感流行期。这对于呼吸道疾病流行期间配置医务人员及药品储备等方面有很好的实际应用价值[12],2014年至2017年间,首都医科大学附属北京朝阳医院有40 d的抗病毒药物(磷酸奥司他韦)的实时储备量为0,其中28 d处于流感流行期间,因此可以考虑根据预测值结果,对流感进行分析和判断,掌握疫情流行特征,指导医院制定应对措施更好地进行流感防控工作,同时也可以对医院储备抗病毒药物的量进行实时调控,保证及时足量的用药需求。

在实际应用过程中,为了保证和提高预警预测的效果,需要收集最新的流感样病例数据并对数据重新进行模型拟合,以修正或重新拟合数据,来反映实际情况的流感预测模型。

猜你喜欢
北京朝阳医院单位根首都医科大学
睡前一杯奶,到底好不好?睡眠专家告诉你真相
同时服用多种药,不良反应如何避免
首都医科大学危重症医学系
医院复工
创新中国背景下专利资助政策与专利申请数的实证研究
等间距组合数的和的闭合公式
首都医科大学北京儿童医院2017年国家级继续医学教育项目(之二)
首都医科大学北京儿童医院2017年国家级继续医学教育项目(之一)
北京朝阳医院:利益调整的艺术
基于MCMC算法的贝叶斯面板单位根检验