突发公共卫生事件数据共享与预警决策系统研究

2023-10-18 13:32拜亚萌刘云朋
科技创新与应用 2023年29期
关键词:公共卫生预警区块

拜亚萌,刘云朋

(焦作大学信息工程学院,河南 焦作 454000)

近年来,突发公共卫生事件频发,危害程度大,涉及范围广,不仅严重威胁到广大人民群众的生命健康,还给经济社会发展乃至国家安全带来多维度、多领域交织叠加的重大风险。早期传染病还具有隐蔽性强、预测性难等特点[1-2],如何利用现代化的技术手段对新发传染病进行及时发现和监测预警,已经成为今后人类治理突发公共卫生事件的重大挑战。

在处理公共卫生事件的风险防控与应急管理过程中,暴露出诸如医疗数据开放共享不足、部门间协同机制不畅、疫情预警监测机制失效、风险研判和决策效率低等现实问题[3-4]。针对上述问题,目前对突发公共卫生事件的应急预警研究已经形成了以数据驱动的动态适应和敏捷处理为核心的风险评估模型和预警决策机制[5]。早期的研究主要从时空维度,对历史病例数据进行分析,采用德尔菲技术(Delphi)、累积和预警模型(CUSUM)等定性分析法[6-7],以及自回归移动平均模型[8](ARIMA)等定量方法分析预警,但预警的精度和及时性都有待提高。随着大数据分析以及神经网络学习在各领域的普及应用,提升树模型[9](Boosting)、循环神经网络模型[10](RNN)等基于机器学习的预警模型也取得了一定的成果。与此同时,区块链技术在医疗和防疫监测方面的应用也正处于积极探索阶段[11-12],Esposito 等[13]采用麻省理工学院的OPAL/Enigma 加密平台和区块链技术相结合的方法,创造了一个关于公共卫生医疗保健信息的存储和分析平台。Kuo 等[14]将区块链技术与隐私保护在线学习技术相结合,设计了公共卫生医疗信息共享平台。综上所述,针对突发公共卫生事件应急预警研究还较为分散,对于多维度数据耦合作用的复杂关系缺乏相应的理论研究和机理分析。另外,区块链在公共卫生医疗应用研究也主要集中于医疗数据信息共享方面,而在突发公共卫生事件的早期数据采集、区域预警、整合政府和社会资源方面缺乏系统的研究。

本文围绕“数据-资源-应用”融合模式,以突发公共卫生事件涵盖的多维度数据为基础,构建基于区块链的数据共享和预警决策系统,实现了医疗信息共享、公共安全监测、过程跟踪溯源和信息收集存证,为公共卫生事件评估预警算法与系统的设计提供新的思路和方案。

1 系统基本框架

1.1 系统架构

本系统以区块链技术为核心,以突发事件演化的动态时序关系为研究对象进行建模,以构建基于区块链的突发公共卫生事件数据共享和预警决策系统,从而实现了知识驱动的疫情风险评估智能决策。本文所设计的系统架构,如图1 所示。

图1 突发公共卫生事件数据共享和预警决策系统架构图

该系统框架以“数据-信息-知识-智能”为设计思路,主要由区块链数据存储与共享平台、风险预警与决策模型2 部分组成,前者是促进突发公共卫生事件治理的基本保障,后者是促进突发公共卫生事件治理的最终目的。

1.2 系统流程

系统的运行机制和预警流程如图2 所示,具体步骤描述如下。

图2 系统总体运行流程图

步骤1 多维度数据获取:以事件演化的动态时序关系建模为理论基础,探析病人的人口统计学特征、症候群特征、其他敏感医疗特征之间的关系,对与公共卫生事件相关的多维度数据进行监测、抽取和集成处理。

步骤2 风险预警模型构建:分析多维度数据之间的关联性,设计基于事件演化的动态时序关系建模的公共卫生事件风险度量算法,实现对突发公共卫生事件风险的预警。

步骤3 评估模型训练学习:采用联邦学习框架对区域内风险评估模型进行自主学习,通过迭代全局参数,不断优化评估模型精度,提高共享效率和实现隐私保护。

步骤4 数据存储和共享交换:以行政区域为单位,构建不同层级的突发公共卫生事件风险区块链,并采用侧链技术实现不同区域间的数据交换与共享。

步骤5 风险预警决策上报:采用智能合约机制完成突发公共卫生事件风险的分布式共识、自动化预警和决策上报发布。

2 关键技术实现

2.1 区块链数据存储与协同共享平台设计

数据存储和协同共享平台通过区域级联盟链+侧链技术相结合的方式,构建多维度、多层级的信息共享平台。该平台的关键技术包括区块链存储结构设计、分布式数据存储、多层级数据交换。

2.1.1 区块链存储结构设计

为保护个人隐私和敏感数据,将个人隐私等敏感数据作为原始数据存储在本地服务器,而将统计性、综合性的医疗数据信息存储在区块体内,并通过入链算法将达到共识的区块添加到相应的区块链,从而形成多条不同区域层级的联盟区块链,极大地降低了数据泄露风险。图3 描述了本文设计的区块链存储结构。

图3 区块链存储结构设计

区块头部信息中,保留了比特币区块的时间戳和Merkle 根,增加了前驱区块的哈希(Hash)值,用作验证目的,并增加了参与交易节点的签名集合,用来确认交易的有效性。区块体中具体交易由资源Hash、交易发起者签名、可搜索加密索引以及交易账本信息等数据组成,其中,资源Hash 记录当前交易记录的Hash 值,用来保证记录的完整性;交易发起者签名用来验证本次交易的真实性;可搜索加密索引为后续安全检索指定的交易做准备。另外,为节省存储空间、保护个人隐私和敏感数据,区块体仅存储交易数据量、模型参数、模型运行时间等大颗粒统计信息,并通过数据加密、参数聚合、权限验证和信用刺激等方式,完成共享数据的安全存储和加密传输。

2.1.2 多层级数据交换技术

本系统以国家-省-市-县四级体系为区域层级划分,涉及了医疗机构、疾控中心、各级政府和卫生行政部门等参与主体。为解决数据冗余和权限分配混乱的问题,本文以行政区域为单元,构建多条区域级的区块链,每条区块链包含区域内所有医疗机构、疾控中心和卫生部门,同一区域内的参与节点可以共享基于本区域内的风险模型、风险指数、医疗资源占用率等资源。不同区域之间的数据交换采用区块链侧链技术完成,实现了不同区域的数据转移和安全共享。以各级卫生部门作为中转节点,将不同区域的数据共享链接在一起,实现全地域疫情预警风险数据的分布式共识和自动化上报。

2.2 风险预警与决策模型设计

突发公共卫生事件风险预警模型的关键技术包括基于事件演化动态适应建模、基于联邦学习的联合模型训练、基于智能合约的风险预警上报。

2.2.1 基于事件演化动态适应性建模

突发公共卫生事件演化是一个多阶段的动态自适应过程,以症状监测事件演化过程为研究对象,利用事件衍生、耦合的时空特点,针对传染病早期的发病率数据呈现出线性和非线性的特征,本文采用线性ARIMA 模型[15]与非线性循环神经网络模型(GRNN)[16]相组合的方式构建基于ARIMA-GRNN 的预警模型,该模型结构如图4 所示。

图4 ARIMA-GRNN 预警模型结构图

传染病预警模型的建模过程主要包括2 个方面:一是寻找灵敏的预警指标、采集获取有效的监测数据,二是构建并训练传染病预警评估模型提升系统的预警能力。其中,预警数据源主要从医院信息系统抽取相关信息,包括患者的个人特征(例如年龄、性别、居住地和职业等)、症候群特征(例如病人主诉、症状、体征和常规检查结果等数据)以及其他敏感医疗特征(例如药房数据、非处方药销售、护士热线电话等数据),通过加工、集成,建立传染病风险数据库。

本文所构建的ARIMA-GRNN 预警模型,不仅兼顾ARIMA 网络模型的线性处理能力,同时兼顾了GRNN 网络模型的非线性逼近能力,充分利用有限的少量数据,实现对不同传染病早期传播风险的有效预警。构建ARIMA-GRNN 预警模型的步骤如下。

首先,收集原始数据,处理和挖掘病人的人口统计学特征、症候群特征、其他敏感医疗特征之间的关系,建立ARIMA 预测模型。

其次,设定输入样本A、输入样本B 的值分别为ARIMA 的拟合值和时间值,输出样本的值为实际值,从而构建出一个二维输入、一维输出的GRNN 网络模型。

最后,根据ARIMA 模型得到的预测值和响应时间变量作为输入,从而完成组合模型的预警结果输出,并通过联邦学习的方式,对模型进行微调训练,修正预测结果,提高预警精度。

2.2.2 基于联邦学习的联合模型训练

为保护患者数据的所有权和隐私权,降低数据泄露风险,本文采用联邦学习(Federated Learning,以下简称FL)技术,在不交换各自隐私数据的前提下,通过链下聚合学习方式完成风险评估模型的训练[17]。FL 是一种分布式机器学习框架,主要特点是确保用户隐私,在不共享原始数据的前提下通过参数交互完成协同训练、生成全局模型,不仅可以有效地保护数据隐私,同时对积极参与高质量数据贡献的医院进行奖励。

首先,参与的医疗机构利用本地数据对本地预警模型进行训练,随机选择一个验证节点将本地模型参数和其他交易账本信息打包上链。其次,各节点实时下载最新区块中其他节点的子模型参数,并在本地进行聚合。然后,通过合约的方式汇总和计算全局模型参数,并将全局参数反馈给各医疗机构,同时生成新的区块以存储本地模型。最后,医疗机构根据反馈的参数再次进行训练,不断迭代,最终得到完整的全局模型,完成整个训练过程。通过联邦学习的加密传输和融合计算,各医疗机构可根据提供的数据量和模型质量,获取相应的贡献值,从而鼓励更多参与者持续贡献,进而提高全局模型精度。

本文使用逻辑回归方法来描述联邦学习问题,设定每个医院的本地数据集Dn,i={xn,i∈Ti,yn,i∈Ti},xn,i是第n 个医院参与训练的输入样本矢量,yn,i是输入样本矢量的标签。因此,本地风险预警模型的局部目标函数可由式(1)表示

全局风险预警模型的损失函数最小化的目标是

第e 轮更新模型后,计算统计出n 个医院的局部模型参数,如式(3)

式中:l 是预定义的学习速率,将局部模型参数上传到共识节点,训练得到e 轮全局模型参数,如式(4)

根据式(1)和式(3)可计算出存储本地训练数据的医院的局部损失函数和局部模型参数。而全局模型参数的精确度则受训练数据质量影响,高精度的本地训练数据集可有效提升训练精度和学习效率。

2.2.3 基于智能合约的风险预警上报

由于本项目是联盟链,无需计费等相关功能,同时为解决传统的风险预警机制中个人经验不足、算法鲁棒性弱等问题,本文采用基于EVM 智能合约虚拟机的防疫预警合约开发引擎,实现自动化的风险预警和决策上报,确保预警的及时性和准确性。EVM 合约内部包括预警逻辑、风险编码、风险类型、风险记录和预警账本等内置信息。另外,根据传染病暴发的空间流行特性以及区域联动预警需求,该应用合约又分为通用预警合约Gwc和区域预警合约Rwc,EVM 智能合约的预警机制如图5 所示。

图5 基于EVM 智能合约的预警机制

预警合约流程如下:将预警合约提前发布到分布式节点中,当每次交易产生,调用Rwc的预警逻辑单元,判断执行是否需要进行预警数据入账,并将最终预警结果更新到预警账本中。其中,Rwc所需的参数都需要在共识节点中实现确认和共识验证,Gwc则负责将各个区域模型的汇总计算得到全局模型参数。

3 实验与分析

实验环境为Ubuntu 的操作系统,分别采用SPSS 16.0、SAS 10.1 软件、MATLAB 神经网络工具箱完成ARIMA 模型、RBF 和GRNN 神经网络模型的参数估计、模型拟合及其检验。实验过程:首先对ARIMAGRNN 模型进行训练,然后利用训练后的ARIMAGRNN 模型对甲乙类传染病月发病率进行监测预警,从而验证预警模型的可靠性。

实验训练集将肺结核每月(2000 年1 月—2005 年7 月)实际发病数据作为输出变量,ARIMA 模型的相应拟合值和时间变量作为二维输入变量,对GRNN 模型进行训练。实验测试集以获取的电子病历数据作为输入变量,将测试集储存在6 个联邦学习数据节点中,每个节点80 份,这些数据节点中的电子病历样本在训练时不会被上传到中心节点,从而保护了患者的隐私。图6 描述了ARIMA-GRNN 组合模型对肺结核发病率的拟合效果。

图6 ARIMA-GRNN 组合模型对肺结核发病率的拟合效果

从图6 可知,ARIMA-GRNN 预警模型的拟合值和实际值贴合紧密,拟合效果良好。另外,表1 对3 种预警模型的预测效果进行比较。

表1 3 种模型的肺结核发病率预测效果比较1/10 万

对表1 数据分析可知,在风险预警准确性表现方面,ARIMA-GRNN 模型优于RBF 模型,ARIMA 模型的准确性最低。

4 结束语

本文以医院信息系统中涵盖的病历数据和运营数据等为数据来源,通过分析患者的人口统计学特征、症候群特征以及其他敏感医疗特征,构建基于事件演化动态适应性建模的疫情风险评估算法,实现疫情早期预警监测。另外,本文融合风险预警模型与区块链技术,构建了基于区块链的数据共享和预警决策系统,脱离依赖静态历史数据或经验案例的被动预案方式,达到了降低强中心化管理带来的责任风险,提高传染病早期风险预警的信息时效性。

猜你喜欢
公共卫生预警区块
区块链:一个改变未来的幽灵
区块链:主要角色和衍生应用
法国发布高温预警 严阵以待备战“史上最热周”
《首都公共卫生》征订启事
区块链+媒体业的N种可能
读懂区块链
园林有害生物预警与可持续控制
《首都公共卫生》征订征稿简则
机载预警雷达对IFF 的干扰分析
公共卫生服务怎加强