基于时变参数的SCUIR传播模型的构建与研究

2022-05-23 10:15孙更新
复杂系统与复杂性科学 2022年2期
关键词:感染者湖北省病例

李 冯,宾 晟,孙更新

(青岛大学计算机科学技术学院,山东 青岛 266071)

0 引言

截至2021年4月18日,中国累计报告新型冠状病毒肺炎(COVID-19)确诊病例103 274人,全世界累计确诊病例141 381 051人。新型冠状病毒作为一种新型传染病毒,其流行病学、发病率、突变频率、基本再生数等传播特性和以往有很大不同,不仅具有潜伏期且处于潜伏期的患者具有传染性,在病毒感染者中存在大量的无症状感染者。在医疗检测条件尚未完备的疫情初期,无症状感染患者极难被发现,这意味着此类病毒携带者在不受控制的情况下自由传播病毒,属于非常危险的一类群体。在传染病模型的研究中考虑无症状感染患者的影响是十分必要的,相应的研究成果也能为今后具有相似传播特性的病毒防控提供重要参考。

自新型冠状病毒爆发以来,国内外研究人员利用传播模型做了大量有关COVID-19的研究工作[1-6]。其中大多数研究都是基于SIR[7]、SEIR[8]等经典传播模型的改进:喻孜等人[9]采用基于时变参数的SIR模型对疫情进行评估和预测,得到了预期拐点和最大确诊数;Joseph T Wu等人[10]基于SEIR模型,利用马尔科夫链蒙特卡罗算法估计了基本再生数,并预测了COVID-19的传播风险;林俊峰[11]在传统SEIR模型基础上,重新将潜伏者定义为体温检测和出行轨迹中存在疑点的人群,将感染者定义为“可疑人群”中被确诊感染COVID-19的人群;文献[12]提出了一种SIRU模型,此模型首次提出了未报告的有症状病例的数量,并且在不同等级的公共卫生防控措施上预测疾病趋势;文献[13]提出了一种SEllaHR模型,研究了隐性感染和隔离对COVID-19的影响;Ivan Korolev等人[14]将死亡病例单独建立舱室,提出了SEIRD模型;Zhai Z M等人[15]建立了一个新的预测建模,通过逆推理分析确定了美国、英国、意大利和西班牙的COVID-19开始于元旦前后。然而,目前大多数针对COVID-19的传播模型研究具有以下3个缺陷:1)模型中涉及的参数都是固定不变的,但在实际情况中,部分参数将随时间变化;2)涉及的影响因素过于简单,未充分考虑COVID-19的传播特性;3)模型中状态的定义不符合实际群体特征。基于上述,本研究考虑新型冠状病毒特有的传播特性,引入无症状感染状态,重新定义了潜伏者为病毒传播过程中的密切接触者,建立了基于时变参数的SCUIR传染病模型。

1 引入无症状感染状态的CUIR模型

1.1 基本假设

根据疫情实际传播情况,本文所建立模型基于如下假设:

1)忽略少数非接触性传播病例。

2)假设确诊者出现症状且被隔离后,不再与易感者接触。

3)忽略病毒传播期间人口的自然死亡及自然出生。

4)不考虑连续变化情况,只考虑以天为单位的离散变化。

1.2 模型状态定义

在传统的SEIR模型中,研究对象存在的状态通常分为S(Susceptible)、E(Exposed)、I(Infected)、R(Removed)4种类型,详细解释如下:

1)S:易感者,表示健康人群,接触传染源可被感染。单位时间内平均有λ个易感者与感染者接触,接触后被传染的概率为φ。

2)E:潜伏者,表示感染了病毒但尚未出现症状的人群。此阶段病毒尚未发作,不具有传染性。单位时间内会有比例ρ的潜伏者出现症状转化为感染者,其中ρ为潜伏期的倒数。

3)I:确诊者,表示已经出现症状的染病者,具有较强的传染性,可将易感者同化。

4)R:移除者,表示感染病毒后死亡或康复的人,感染者在痊愈后获得抗体,不会再恢复到易感状态,感染者单位时间内的移除率为γ。

图1展示了SEIR模型各状态之间的转换,可以看出模型相对简单,不足以模拟COVID-19的实际传播情况。

图1 传统SEIR模型示意图Fig.1 Schematic diagram of the traditional SEIR model

在COVID-19的防控中,主要存在两个传播特点:1)病毒的密切接触者通过一段时间的隔离观察,可以确定是否被传染,因此可以通过追踪密切接触者来监控病毒传播情况;2)存在大量具有传染性的无症状感染者,这部分人群携带病毒但却被当成健康人,在被发现或出现症状前一直处于自由传播状态,在医疗检测条件并不充足的疫情初期,无症状感染者难以被第一时间发现并隔离,所以此类人群对疫情的发展将产生重要影响。

综上所述,本文基于SEIR模型做出如下改进,提出SCUIR模型:

1)重新定义潜伏者(E)为病毒的密切接触者C(Contacted),即未采取有效防护措施与传染源近距离接触的易感者。此类人群可能携带病毒也可能不携带病毒,密切接触者中的病毒携带者当处于医学观察或被隔离状态时,一旦出现症状将立即成为确诊病例,而未携带病毒的密切接触者经过观察期后回归到易感人群中。

2)引入无症状感染者状态U(Undiscovered)。将病毒传播过程中未出现症状且混在健康人群中的病毒携带者定义为无症状感染者(U),此类人群具有传染能力却未被发现,未受到任何强制隔离措施,在病毒潜伏期一直处于自由传播状态,这种情况下,其传播能力将远大于携带病毒的密切接触者(C),将无症状感染者群体单独分离建立的传染病模型更能模拟出真实的传播情况。

3)重新定义确诊者(I)。由于密切接触者(C)群体处于实时监控状态,出现临床感染症状后会被第一时间执行严格的隔离措施,并且随着疫情防控措施的升级,无症状感染者(U)出现症状后也会第一时间做核酸检测或上报政府,进而被隔离。在绝大多数情况下,处于隔离治疗状态的感染者不会再与易感者接触,直至死亡或治愈出院。故本文认为确诊者(I)不具备传染性。

1.3 模型建立

本文提出的SCUIR模型中各状态转换示意如图2所示:

图2 SCUIR模型示意图Fig.2 Schematic diagram of the SCUIR model

本研究认为易感者(S)可被感染病毒的密切接触者(C)、无症状感染者(U)传染。病毒感染者在被确诊后,与他在无有效防护情况下有过密切接触的人就会被转化为密切接触者(C),假设感染病毒的密切接触者在潜伏期间平均密切接触λ1个易感者(S),被确诊的无症状感染者在未出现症状前平均密切接触λ2个易感者(S),无症状感染者(U)在单位时间内可将α个易感者传染转化为无症状感染者。则易感者的动力学方程可表示为

(1)

密切接触者(C)可由易感者(S)转化,感染病毒的密切接触者(占C比例为p)在经过病毒潜伏期后出现症状,转化为感染者(I),μ为单位时间内感染病毒的密切接触者转化为感染者的比例,同时未感染病毒的密切接触者(占C比例为1-p)经过观察期后回归易感状态。则密切接触者(C)的动力学方程为

(2)

无症状感染者(U)可通过接触将病毒传播给易感者(S),将其转化为U类人群,也可能在检测时被发现感染病毒,转化为确诊者(I)。无症状感染者分为两类,一类是由于监测措施尚未到位,健康群体中存在许多未检测出来的病毒携带者,另一类人群携带病毒,但是由于机体免疫力较强,未出现染病症状,经过一段时间会自愈。无症状感染者的动力学方程为

(3)

密切接触者(C)出现临床症状后被确诊成为感染者(I),无症状感染者在经过潜伏期后出现症状也会被确诊,感染者(I)经过隔离治疗后会康复或死亡,从而转化为移除者(R)。感染者(I)的动力学方程为

(4)

移除者(R)由无症状感染者(U)中的自愈者和感染者(I)中的康复者或死亡者组成,其动力学方程如式(5)所示。

(5)

官方公布的数据均以天为单位,因此本文仅考虑离散变化情况,将微分方程转换为如式(6)的差分方程。

(6)

2 参数优化与反演

本文所建立的模型中共包含9个参数,其详细含义如表1所示。根据官方公布的真实数据,可以对{α,β1,β2,μ}的值进行估计,{λ1,λ2,p}的值无法通过已知数据直接获取,将采用参数反演来测定最优值。

表1 模型参数解释Tab.1 Model′s parameters

参数优化方程式如(7),优化目标为实际数据值与模拟数据值的偏差最小。本文介绍两种式(7)的求解方法,其中一种是,在已知{α,β1,β2,μ}值的情况下,分别求{λ1,λ2,p}的偏导数,得到一个三元方程组,求解方程组即可得到参数最优值,此外,也可采用枚举法得到最优值。

(7)

考虑部分参数会随时间增长发生变化,故本文将其设置为时变参数。设γc,t和γd,t分别为日治愈率和日死亡率,其数值为当天新增出院人数和新增死亡人数占前一天感染者人数的比率,对实际数据进行拟合,结果如图3所示。

图3 时变参数拟合结果Fig.3 Fitting results for time-varying parameter

湖北省的治愈率和死亡率呈现出明显的随时间变化而变化的趋势(见图3),因此,采用时变参数才能正确模拟疫情发展的真实情况。时变参数拟合结果使用Power函数描述,结果如表2所示。

表2 时变参数拟合结果Tab.2 The fitting results for time-varying parameter

3 模型拟合结果与分析

本研究基于中国湖北省卫生健康委员会官网(http://wjw.hubei.gov.cn)公布的湖北省2020年1月15日—2020年4月26日的疫情数据进行实验。为验证本文模型的性能优越性,同时基于SIR模型、SEIR模型进行模拟实验,并对比结果,评价指标为与实际活跃病例数的均方根误差(RMSE)和平均相对误差(MAPE)。由于2020年2月12日之前,国家卫生健康委员会公布的确诊病例数据不包括临床诊断病例,导致实际数据在2020年2月12日出现断层。此外,在中国政府针对新冠肺炎疫情采取的一系列重要措施的影响下,新增确诊人数于2020年3月18日实现了第1次新增确诊人数为0,标志着疫情被基本控制。综合以上数据特征,本文选取湖北省2020年1月25日至2020年3月18日的数据进行拟合,并以2020年2月12日为时间节点,分为两个时间段进行分析:1)第1阶段为2020年1月25日至2020年2月11日;2)第2阶段为2020年2月12日至2020年3月18日。

3.1 湖北省第1阶段COVID-19回溯结果

疫情初期官方公布的数据中并未包括无症状感染者数量,本文根据无症状感染者占活跃病例的平均比例来设定U0值,S0值为去除非易感状态人群的湖北省总人口,{C0,I0,R0}值采用2020年1月25日湖北省的真实数据,实验结果如表3、图4所示。图4显示:SIR模型拟合结果在2月5日前明显低于实际值,并于2月11日呈现出提前出现拐点的趋势;SEIR模型拟合结果呈现出加速上涨趋势,至2月12日较真实数据误差超过14%;SCUIR模型拟合趋势明显更好,并且相对误差始终保持在4%以内。表4展示了3种模型的评价结果,SCUIR模型的拟合精度最高,其中,均方根误差值(RMSE)比SIR模型缩小了14%,比SEIR模型缩小了39%,平均相对误差值(MAPE)比SIR模型缩小了16.8%,比SEIR模型缩小了32%。

表3 湖北省第1阶段参数值Tab.3 The first stage simulation parameter value of Hubei Province

图4 第1阶段模拟结果Fig.4 The first stage simulation results

表4 第1阶段模型评价Tab.4 The evaluation for the first stage model

表3所示第1阶段各参数值中,无症状感染者平均感染人数达到了0.473人,这表明:由于民众自我防控意识低、医疗检测条件尚未完善等原因,导致无症状感染者完全属于自由传播状态,属于高传播风险水平。密切接触者的密切接触人数λ1与无症状感染者的密切接触人数λ2分别为1.18人、2.11人,λ2值为λ1值的1.78倍,说明无症状感染者的危险性要远高于密切接触者中的病毒携带者。此外,第1阶段密切接触者中的病毒携带者比例(p值)达到35.5%,这表明通过追踪并隔离密切接触者人群可以控制大部分被传染的患者,从而有效防止病毒的进一步扩散。

3.2 湖北省第2阶段COVID-19回溯结果

第2阶段模型初始值设置为湖北省卫生健康委员会官网2020年2月12日公布的数据,由于第2阶段国家采取的防控措施与第1阶段存在差异,将导致模型参数发生变化,实验结果如表5、图5所示。

表5展示了湖北省疫情第2阶段的实验结果,其中,无症状感染者平均感染人数α较第1阶段减小了94.1%,无症状感染者平均密切接触人数λ2减小了40.3%,说明随着中国政府限制大规模集会、控制出行等措施的开展以及民众自我防护意识的增强,疫情正在被有效控制。另外,无症状感染者的日确诊率β1增大了3.83倍,说明随着病毒检测周期的缩短,隐藏在人群中的无症状感染者在被快速发现。观察图5、表6可以看到本文模型很好地复现了2020年2月12日至2020年3月18日湖北省疫情发展趋势,并且相比于SIR模型的RMSE值、MAPE值分别缩小了9.5%,8.3%,比SEIR模型的RMSE值、MAPE值分别缩小了10.5%,13.2%,进一步体现了本文模型的优越性。

表5 湖北省第2阶段参数值Tab.5 The second stage simulation parameter value of Hubei Province

图5 第2阶段模拟结果Fig.5 Second stage simulation results

表6 第2阶段模型评价Tab.6 The evaluation for the second stage model

3.3 湖北省总体模拟结果

对完整时间段(2020年1月25日—2020年4月26日)的回溯中,2020年1月25日—2020年2月12日数据采用调整后的数据(加上2月12日之前官方未公布的临床诊断病例)。图6a展示了3种模型的拟合结果,从宏观趋势来看,SCUIR模型的拟合结果相比较于SIR模型、SEIR模型与实际疫情发展趋势最为吻合。其中,SIR模型由于未能考虑疾病的潜伏期、无症状感染者等传播特性,导致拟合结果中的活跃病例数呈现随时间快速上升/下降,拟合活跃病例数峰值大于疫情的实际规模且峰值出现时间有较大偏差。SEIR模型虽然考虑了疾病的潜伏期,但是未考虑无症状感染者的自愈以及确诊者的严格隔离对病毒传播的阻断作用,尽管模型拟合的活跃病例数峰值出现的时间与实际情况很接近,但是其模拟结果与实际疫情发展规模依旧存在较大偏差。而SCUIR模型补充了上述模型的不足,并且治愈率、死亡率采用了更为合理的时变参数,因此,实验结果中的病例数峰值出现时间、疫情发展趋势都与实际数据最为吻合,模拟精度最高,与实际数据的拟合误差较SIR模型、SEIR模型分别缩小了47.6%,26.4%。

除了官方数据涉及的人群分类,SCUIR模型还能够计算出官方数据无法完全统计的无症状感染人群数量(见图6b)。无症状感染者在未采取隔离措施的情况下自由传播病毒,具有相当大的危险性,在整个疫情传播期间持续出现了无症状感染病例,尤其在疫情后期,现存无症状感染病例数量甚至超过了活跃确诊病例数量,因此,政府等相关机构不可放松警惕,应加强对无症状感染者的发现、报告和管理工作。

4 结论

本文结合COVID-19的特殊传播特性,采用时变参数,提出了一种包括“易感状态,密切接触状态,无症状感染状态,确诊状态,移除状态”等5类状态的SCUIR传播模型。利用中国湖北省的真实疫情数据进行了实验验证,结果表明:1)SCUIR模型对于COVID-19的历史数据具有更高的拟合精度,各离散点的相对误差基本在5%以内,比SIR模型总体降低了8.3%~47.6%的拟合误差,比SEIR模型总体降低了10.5%~32%的拟合误差;2)SCUIR模型可以挖掘出在实际疫情数据统计中难以完全统计的隐藏数据,例如本实验中的无症状感染者数量,进一步刻画了疫情传播机理。不仅如此,本文模型可以通过定量控制参数模拟不同防控措施,相应的模型拟合结果可以更直观地评估不同措施对疫情发展的影响,有利于制定合理、高效的防疫政策。总而言之,SCUIR模型对于与COVID-19有相似传播特性的疫情防控有较大的指导和参考价值。

猜你喜欢
感染者湖北省病例
警惕新冠病毒无症状感染者
“病例”和“病历”
本土现有确诊病例降至10例以下
湖北省2016年9月水产品塘边价格
湖北省水产品塘边价格
妊娠期甲亢合并胎儿甲状腺肿大一例报告
Meckel憩室并存异位胰腺和胃黏膜并出血一例