基于ARMA-SSESM组合模型的危险品道路运输泄漏事故预测研究*

2023-11-07 13:43白金花程智慧向前前施星宇
中国安全生产科学技术 2023年10期
关键词:危险品预测值运输

白金花,刘 勇,2,3,程智慧,向前前,施星宇

(1.湖南科技大学 资源环境与安全工程学院,湖南 湘潭 411201;2.湖南科技大学 煤矿安全开采技术湖南省重点实验室,湖南 湘潭 411201;3.湖南科技大学 南方煤矿瓦斯与顶板灾害预防控制安全生产重点实验室,湖南 湘潭 411201;4.长沙理工大学 电气与信息工程学院,湖南 长沙 410114)

0 引言

危险化学品(文中简称“危险品”)的道路运输环节是化工产业链条的重要一环[1]。我国每年通过道路运输的危险品超过10亿吨,占危险品运输总量的70%以上,占道路年运输总量的30%以上,且呈上升趋势[2]。危险品运输途中因驾驶员操作不当、危险品防护不到位或地理环境差等因素容易发生碰撞、侧翻、追尾等交通事故,进而导致危险品泄漏事故的发生[3]。2013—2018年,全国危险品道路泄漏事故共发生1600余起,约占全年事故总量的84.77%[4]。危险品道路运输泄漏事故已成为制约化工行业发展的重要因素之一,严重威胁人民生命财产安全。开展危险品道路运输泄漏事故预测研究,可为事故预防与应急处置提供参考[5],对于公共交通安全以及经济社会和谐发展具有重要意义。

时间序列预测模型被广泛应用到预测领域。Steven等[6]将时间序列模型应用于道路交通的预测领域。Ayad等[7]验证了时间序列模型对交通事故死亡人数预测的有效性。Li等[8]建立运输事故时间序列和自回归滑动平均(ARMA)模型对2020年第一季度危险品泄漏事故数量进行预测。以上研究说明时间序列ARMA模型对于预测具有较强适用性,ARMA模型描述线性规律的能力较强,数据中的非线性规律则以残差的形式体现,理想情况下残差序列的自相关系数均为零,但在实际中这一要求往往无法达到。

SSESM属于指数平滑模型中的1种,是由美国学者布朗(Robert G.Brown)于1960年提出的[9]。马浩凡[10]为确定影响二手车进口的因素,并分析二手车对环境的影响,采用简单季节指数平滑、多元回归和相关分析方法对二手车进口趋势进行数据分析和解释预测结果。石明珠[11]基于内部因素的填充方法主要是根据各监测站点按小时收集的PM2.5浓度数据,使用反距离加权法和简单季节指数平滑法分别从全局空间和时间上进行填充。Moiseev[12]应用简单季节指数平滑预测2015年—2019年危机期间沿世界海洋6条不同石油运输路线的油轮平均定期租船价值。SSESM模型能将非线性时间数据序列的数量差异抽象化,对序列进行修匀从而消除不规则和随机扰动,显示出预测对象变动的基本趋势,但对预测精度较难达到全局最优。

Bates等[13]在1969年首次提出组合预测的理论和方法,将不同的预测方法进行组合,以求产生较好的预测效果。上述2种单一模型在预测中有着各自的优势,又都存在一定的局限性。ARMA-SSESM组合模型获取的信息更加全面,削弱了ARMA模型对于残差中信息的缺失以及SSESM模型预测精度的局限,得到的预测值有更理想的预测效果。魏杏[14]基于指数平滑法和ARIMA组合预测模型应用于交通量预测,通过实例验证组合预测效果良好。陈云浩等[15]人通过对时间序列的研究分析,提出基于ARMA模型和Holt-Winters指数平滑模型进行企业用电量预测的方法,二者组合应用具有较高的可行性和推广价值。以上研究表明指数平滑模型和ARMA组合模型实用性较强,但ARMA-SSESM组合模型目前在危险品道路运输领域涉及较少。

本文根据2013—2020年道路运输过程中危险品泄漏事故信息,运用时间序列方法分析数据,建立ARMA事故预测模型和SSESM(simple seasonal exponential smoothing method)模型组合模型,并对比分析3种方法的预测精度,从而验证组合预测模型在危险品道路运输泄漏事故预测中的优越性。

1 ARMA预测模型

2013—2020年危险品道路运输事故数据来源于石化事故分析与数据解读平台(petrochemical accident analysis platform,PAAP)[8]。通过人工核对与数据清洗,最终获得2 216起有效数据。事故原始数据序列如图1所示。

图1 2013—2020年事故原始数据序列Fig.1 Time series of accident raw data from 2013 to 2020

ARMA模型属于混合模型,一般的ARMA(p,q)模型的基本形式如式(1)所示:

(1)

式中:Xt为回归值;p与q是非负整数;ut为干扰项;φi为自回归系数;θj为滑动平均系数。

AR模型与MA模型是ARMA的特殊情况,当q=0时,成为自回归模型AR(p);当p=0时,则是移动平均模型MA(q)。

1.1 时间序列平稳性检验

运用Eviews软件对时间序列进行带截距项的模型检验,得到检验结果如表1所示。

表1 时间序列单位根检验结果Table 1 Unit root test results of time series

由表1可知,统计量T值的绝对值大于其在1%,5%,10%检验水平下的临界值。即拒绝序列有单位根的原假设,该检验序列不具有单位根,是平稳序列,即所研究序列为平稳非白噪音时间序列。

1.2 模型形式识别

在对时间序列运用B-J方法建模时,应当运用序列的自相关函数(autocorrelation function,ACF)与偏自相关函数(partial autocorrelation function,PACF)对序列适合的模型类型进行识别。

其中自相关函数的定义如式(2)所示:

(2)

ARMA(p,q)模型的k阶自相关函数(ACF)定义如式(3)所示:

ρk=φ1ρk-1+…+φpρk-p,k≥(q+1)

(3)

偏自相关函数(PACF)是ARMA模型的另一个统计特征,其定义如式(4)所示:

(4)

式中:k代表滞后量;φkj=φk-1,j-φkkφk-1,k-j,j=1,2,…,s-1。

服从ARMA(p,q)模型的时间序列具有明显的统计特征,因此可以通过其自相关或者偏自相关的拖尾或者截尾现象来确定模型形式。

当时间序列ACF与PACF均未出现拖尾,难以进行判断。因此根据不同模型变量对应的调整R2值(adjusted r-squared)、赤池信息准则(akaike information criterion,AIC)与施瓦兹准则(schwarz criterion,SC)作为选择模型的重要标准[16]。

PACF在滞后3阶出现截尾,可以判断模型自回归过程可能为3阶。自相关系数在滞后2阶后均落在随机区间内部。因此经过初步判断可能适合的模型有AR(3)、MA(2)与ARMA(3,2)。分别计算AR(3)、MA(2)与ARMA(3,2)3组模型的调整值R2、AIC值与SC值。结果如表2所示。

表2 模型参数对照Table 2 Comparison of model parameters

对比3组模型的调整值R2、AIC值与SC值,数据显示出ARMA(3,2)模型的调整值最大,同时AIC值与SC值均最小,因此确定ARMA(3,2)为危险品道路运输泄漏事故预测最佳模型。

1.3 模型参数估计

利用最小二乘估计方法估计模型中未知参数的值,确定模型的最小二乘估计结果如式(5)所示:

(5)

误差项方差的估计值如式(6)所示:

(6)

1.4 模型检验

运用Eviews软件对残差序列进行χ2检验,输出结果如表3所示。

由表3可知,残差序列自相关系数都落入随机区间,自相关系数(AC)绝对值几乎都小于0.1,与0无明显差异,表明残差序列是纯随机的。即表明模型ARMA(3,2)对时间序列拟合效果较好。

在对2021年事故数据进行预测之前,先对样本内2019—2020年危险品道路运输各月份事故数量进行预测,并将预测结果与2019—2020年实际观测值对比,以此检验模型预测精度。

运用ARMA(3,2)模型对2019—2020年各月份事故数量进行预测,得到预测值与实验值如图2所示。

图2 2019与2020年事故数量预测值与实验值对比Fig.2 Comparison on predicted and experimental values of accident numbers in 2019 and 2020

2019年事故数量实验值与预测值平均值分别为23.00,23.30,标准差分别为7.01,4.83。2020年事故数量实验值与预测值平均值分别为25.40,23.80,标准差分别为7.72,4.62。2019年与2020年事故数量实验值与预测值平均值和标准差基本一致,所建立的ARMA模型可适用于危险品道路运输泄漏事故数量的预测。

2 SSESM预测模型

SSESM是对时间序列由近及远采取具有逐步衰减性质的加权处理,是移动平均法的改进型。该方法假定,未来预测值与过去已知数据有一定关系,近期数据对预测值的影响较大,远期数据对预测值的影响较小[17]。一般的SSESM模型的基本形式如式(7)所示:

St=αXt+(1-α)St-1

(7)

式中:St为第t周期的指数平滑值;Xt为第t周期的实验值;St-1为第t-1周期的指数平滑值;α为平滑系数,即权数(0≤α≤1);t为周期数(t=1,2,3,…)。由此可见,SSESM就是用第t期的指数平滑值作为时间序列{Xt}的第t+1期预测值。

预测的精度与平滑系数α值的选择关系较大。当序列呈较稳定的水平趋势,或者虽有波动,但长期趋势变化不大时,α宜取小值[0.1,0.3],以充分发挥历史数据的作用;当数列波动较大,长期趋势变化幅度较大时,α宜取大值[0.5,0.9],以跟踪近期数据的变化[18]。由图1可知,数据虽有波动,但长期趋势变化不大,平滑系数分别取0.10,0.20,0.30,对危险品道路运输泄漏事故的历史数据进行预测,分别计算其指数平滑值及平均绝对误差(MAE)如式(8)所示:

(8)

经式(8)计算得平滑系数α取0.10,0.20,0.30的平均绝对误差分别为1.730,2.885,3.861,平滑系数α取0.10的平均绝对误差最小,拟合效果更好,当平滑系数α取0.10时,2013—2020年危险品道路运输泄漏事故实验值与预测值拟合情况如图3所示。

图3 a=0.1 SSESM模型2013—2020年泄漏事故数量实验值和预测值拟合Fig.3 Fitting on experimental and predicted values of leakage accident numbers from 2013 to 2020 by SSESM model at a=0.1

由图1可知,危险品道路运输泄漏事故具有季节性趋势,选用SSESM模型进行预测。用均方根误差(RMSE)如式(9)所示、平均绝对百分误差(MAPE)如式(10)所示、平均绝对误差(MAE)来验证SSESM模型预测精度。

(9)

(10)

由表4所示,简单季节性模型均方根误差(RMSE)、平均绝对百分误差(MAPE)、平均绝对误差(MAE)的拟合参数值较小,SSESM模型的平稳R2和R2更大,分别是0.713,0.332,说明简单季节性指数平滑模型满足预测精度要求。

表4 SSESM模型相关参数Table 4 Related parameters of SSESM model

用SSESM模型对2019—2020年各月份危险品道路运输泄漏事故数量进行预测,得到预测值与实验值如图4所示。

由图4可知,2019年—2020年事故数量预测值与实验值走势基本吻合,所建立的SSESM模型可用于危险品道路运输泄漏事故数量预测。

3 ARMA-SSESM组合预测模型

为提高预测精度,组合预测法需要将2种或者2种以上的预测方法进行组合预测[19]。ARMA模型综合考虑了时间序列的趋势、周期的变化及随机干扰等情况,能较好地反映时间序列的趋势和变化;而SSESM模型按均方误差最小的原则确定平滑系数,根据数据的远近依次给予大小不等的权重。ARMA模型和SSESM模型都是通过揭示历史数据随时间变化规律,并将这种规律外延进行预测,适用于短期预测。

根据等权组合预测[20]的方法,对2个模型预测的结果进行加权计算出ARMA-SSESM组合预测值,并取该值为最后的预测值,权重取值如式(11)所示:

(11)

式中:ω为权重;σ为预测值标准差。

根据预测结果,计算出各自的标准差。得到结果为:ARMA模型预测标准差为3.096,SSESM预测标准差为2.734,可以确定ARMA模型权重为0.530,指数平滑权重为0.470,因此,可得基于ARMA-SSESM组合预测公式如式(12)所示:

y*=ω1y1*+ω2y2*=0.53y1*+0.47y2*

(12)

式中:y*为组合预测值;y1*为ARMA模型预测值;y2*为SSESM模型预测值。

4 对比分析

运用ARMA(3,2)模型、SSESM模型和ARMA-SSESM组合模型对2021年1月—2021年6月危险品道路运输事故数量进行预测,并获取2021年1月—2021年6月危险品泄漏事故的实验值数据,将预测值与实验值进行相对误差分析。获得结果如表5所示。

表5 3种预测模型2021年1月—2021年6月危险品泄漏事故实验值与预测值对比Table 5 Comparison on experimental and predicted values of hazardous chemicals leakage accidents from January to June in 2021 by three prediction models

由表5可知,ARMA-SSESM组合模型预测值与实验值的相对误差值较小,预测效果较为理想。

利用3种模型分别预测2021年1月—2021年6月事故数量,比较3种模型的预测精度,由表6可知,组合模型预测效果最佳,ARMA模型预测效果次之,SSESM模型在3种模型中预测效果最差。3组数据表明组合模型预测精度较高,符合预测要求。

表6 3种预测模型的预测效果比较Table 6 Comparison on prediction effect of three prediction models

2021年3月的危险品道路运输泄漏事故数据较其他月份波动较大,是由于危险货物春运政策的影响。我国春运期间(一般是春节前后20 d)不允许危险品运输车辆上高速。为了应对春运期间危险品物流受限的影响,1月往往会增加货运量;3月会出现危险品货运量的报复性反弹,从而危险品道路运输泄漏事故数量出现增长。为有效预防危险品道路运输泄漏事故发生,危险品道路运输企业要在春运前后加强危险品驾押人员安全意识教育与培训,道路交通运输和交警部门应在春运前后加强危险品道路运输的安全监管与执法检查工作。

5 结论

1)本文统计分析了2013—2020年中国危险品道路运输月度泄漏事故,建立的ARMA(3,2)模型及指数平滑系数α=0.1的SSESM预测模型,根据预测值标准差确定ARMA模型和SSESM模型权重,确定组合预测公式。

2)建立的ARMA-SSESM组合预测模型的预测效果在3种模型中最佳,具有良好的预测精度,能够提高事故预测的准确性,采用组合预测模型,可以减小模型预测产生的误差。

3)事故预测结果为危险品道路运输企业和监管部门提出了对策建议,可为危险品运输泄漏事故预防提供参考依据。在后续的研究中,需考虑多种方法的结合,进一步提高模型的预测精度。

猜你喜欢
危险品预测值运输
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
法电再次修订2020年核发电量预测值
受阻——快递运输“快”不起来
比甩挂更高效,交换箱渐成运输“新宠”
是谁让危险品企业埋伏居民区?
一种新型危险品液罐车安全阀
关于道路运输节能减排的思考
基于ARM的危险品搬运机器人的设计与实现
综合运输