EV71型手足口病重症早期预警模型的建立

2022-02-04 11:16陈晓瑾陈海哨周红萍

浙江医学 2022年23期

陈晓瑾陈海哨周红萍

肠道病毒引起的手足口病（hand-foot-mouth disease,HFMD）是5岁以下儿童常见的传染病，其病原体以肠道病毒71型（EV71）和科萨奇病毒A组16型（Cox A16）最为常见。严重的进行性HFMD主要由EV71型导致，病情凶险，病死率高[1]。早期识别EV71型HFMD重症倾向，对提高重症HFMD患儿的救治成功率、降低病死率具有重要意义。HFMD危险因素复杂，通常呈非线性关系，难以用传统方法如线性回归或logistic回归拟合。误差反向传播（back propagation,BP）神经网络在处理复杂非线性关系时的分析正确率较高[2-4]。遗传算法（genetic algorinthm,GA）遵循自然界“优胜劣汰”的选择规律，以进化权值和阈值作为最优解，增强了网络的全局搜索能力，灵敏度、特异度和准确度均优于BP神经网络[5-7]。本研究以HFMD患儿住院资料为基础，采用MATLAB R2016b神经网络工具箱构建多层前馈的BP神经网络，利用GA工具箱优化初始权值和阈值，构建遗传算法优化误差反向传播（genetic algorinthm back propagation,GABP）神经网络模型并预测HFMD重症化倾向，以期为重症EV71型HFMD的早期识别和临床早期干预提供参考。

1 资料和方法

1.1 研究设计参照《2010版手足口病诊疗指南》[8]，回顾性分析杭州市儿童医院在2014年1月—2016年12月收治的确诊为EV71型的469例HFMD患儿信息，其中HFMD重症病例385例（重症组），普通型（轻症）病例84例（普通组）。以入院时临床表现、检查检验结果、发病过程等临床相关指标作为模型输入参数，以是否具有重症化倾向作为输出指标，根据ROC曲线和AUC、灵敏度、特异度和均方根误差评价GABP模型，并进行验证。以2014年1月—2015年12月收治的352例患儿作为训练组，用于构建GABP模型，其中重症288例，轻症64例；以2016年1月—2016年12月收治的117例患儿作为验证组，用于模型的验证和评价，其中重症97例，轻症20例。限定患儿发病自入院时间≤3 d。

1.2 资料收集和处理综合文献报道和儿童感染科医师临床经验，从病例资料中提取发病和临床经过、人口学情况，选取可能的影响因素如儿童职业（散居/托幼）、性别、月龄、体质量、热峰、发热（≥37.4℃）/高热（＞39.0℃）天数、发病至就诊时间、发病至入院时间、皮疹分布（手、足、口腔）、呼吸系统和神经系统情况（咳嗽、呼吸节律不齐、易惊、惊跳天数、手足抖动、颈强直、嗜睡、精神差、惊厥、呕吐、烦躁）、入院FPG水平以及WBC、中性粒细胞、淋巴细胞、CRP、EV71病毒载量、通用型病毒载量、机体免疫功能（IgA、IgM、IgG水平）、心肌酶谱（肌酸激酶，creatine kinase,CK；肌酸激酶同工酶，creatine kinase-MB,CK-MB）水平等34个指标作为模型输入参数。采用ACESS数据库双人录入和核查建立预测、验证数据库。

1.3 GABP神经网络的构建应用MATLAB软件R2016b中mapminmax函数对469例HFMD患儿数据归一化，非数值型参数用0或1表示，归一化至[-1，1]。以34个危险因素作为输入变量，重症和轻症作为输出变量（重症为1，轻症为0），建立BP模型。隐含层和输出层的传递函数分别采用tansig和purelin。网络的训练函数采用函数trainlm。最大训练步数1 000步，训练误差角度目标0.000 1，学习速率为0.01。通过计算危险因素的平均影响值（mean impact values,MIV）对输入变量进行优化，除去冗余变量，建立GABP模型。采用五折交叉验证法验证模型的适用性和准确性，每折所构建的模型均运行3次。

1.4 GABP模型预测效能的评价比较AUC，评价BP模型和GABP模型的特异度和灵敏度。当0.7≤AUC＜0.8，认为模型的预测能力可以接受；0.8≤AUC＜0.9，认为模型的预测能力很好；AUC≥0.9，认为模型的预测能力杰出；AUC越接近1，说明预测效果越好。统计不同条件下MATLAB软件的运行步数和运行时间，比较BP模型和GABP模型的运行性能。通过均方根误差衡量模型的拟合精度，其值越小说明模型拟合精度越高。

1.5 统计学处理采用SPSS 13.0统计软件。正态分布的计量资料以±s表示，非正态分布的计量资料以M（P25，P75）表示，计数单位以例数表示。计量资料采用两独立样本t检验或Mann-WitneyU检验，计数资料采用χ2检验。P＜0.05为差异有统计学意义。

2 结果

2.1 两组患者危险因素比较 HFMD重症组385例，其中男234例（60.8%），女151例（39.2%），平均年龄（31.85±16.21）个月；普通组84例，其中男51例（60.7%)，女33例（39.3%），平均年龄（31.49±15.34）个月。重症组和普通组患儿年龄、性别比较，差异均无统计学意义（均P＞0.05），最高体温、发热（≥37.4℃）天数、高热（＞39.0℃）天数、口腔疱疹、FPG、中性粒细胞、淋巴细胞、惊跳天数、精神差、易惊、手足抖动、呕吐和呼吸节律不齐等比较，差异均有统计学意义（均P＜0.05），见表1。

表1 重症组和普通组危险因素的单因素比较

2.2 BP神经网络输入变量的优化 34个危险因素中，MIV绝对值排名前20位的依次为惊跳天数、通用型病毒载量、最高体温、EV71病毒载量、IgM、精神差、CK-MB、FPG、易惊、咳嗽、发热（≥37.4℃）天数、颈强直、职业（散居/托幼）、IgA、性别、呼吸节律不齐、高热（≥39.0℃）天数、发病至入院时间、手足抖动、体质量，见表2。将BP模型的输入变量由34个参数调整为20个后，AUC从0.630增加到0.723，可见模型拟合度提高，见图1。因此，选取以上20个危险因素作为BP神经网络的输入变量。

表2 危险因素的MIV绝对值

图1 不同输入变量的ROC曲线

2.3 隐含层神经元数的优化网络性能指标的均方根误差预设为0.01，MATLAB最大步数限定1 000，考察不同隐含层神经元数下网络实际运行情况和AUC，结果可知，隐含层神经元数目为10和20时，BP神经网络和GABP神经网络均无法满足均方根误差≤0.01的要求，所需的运行步数均已达到预设最大值。随着神经元数的增加，模型达到预设误差范围的运行步数和运行时间均减少，AUC值增加，可见在一定范围内增加隐含层神经元数可提升网络的运行性能和预测能力。相对于BP神经网络，GABP神经网络构建模型拟合性能更好，效率更高。当隐含层神经元个数为40时，GABP模型网络性能和预测能力均为最佳。由此，最终GABP模型的网络结构为20→40→1，即输入层变量为20，隐含层和输出层的神经元数分别为40和1，见表3。

表3 隐含层神经元数对BP模型和GABP模型性能的影响

2.4 GABP模型预测能力评估采用五折交叉验证法比较两种预测模型的ROC曲线参数，GABP模型的灵敏度和特异度均高于BP模型（P＜0.05），说明BP模型经GA优化后，真阳性率更高，假阳性率更低。结合均方根误差和AUC，相对于BP模型，GABP模型的网络稳定性和预测准确性更高，差异有统计学意义（P＜0.05），见表4。

表4 BP模型和GABP模型预测效果比较

3 讨论

HFMD重症化的危险因素是临床的研究热点。根据BP神经网络输入变量的MIV值筛选出前20位危险因素，其中惊跳天数、手足抖动、最高体温、发热天数、FPG、精神差、易惊、高热天数和呼吸节律不齐在单因素分析中也显示出有统计学差异，提示这些指标与重症化具有高度相关性，与文献报道一致[9-10]。但是仍有部分危险因素的单因素分析结果与MIV排序不同，如中性粒细胞比例在单因素分析中有统计学差异（P＜0.01），而在MIV排序中位列29位。这可能是BP模型与单因素分析对数据处理和统计方式的不同导致。t检验或χ2检验通过对单个危险因素进行比较，判断各危险因素在两组之间是否存在统计学差异。BP神经网络主要分析危险因素与预测结果之间的内在联系，根据MIV绝对值的大小判断各危险因素对网络预测性能的影响程度，从而实现危险因素的筛选。在GABP神经网络中，CK-MB位列MIV排序第7，而单因素分析中无统计学差异。心肌组织是EV71容易侵犯的部位，心肌损伤也是HFMD患儿常见的脏器并发症，目前已经发现CK-MB对HFMD的重症化产生影响[11-13]。对输入变量的MIV分析可见，CK-MB在HFMD的重症化中发挥着重要的作用。GABP模型中，IgM在MIV排序中位居第8位，推测免疫功能可能影响HFMD的发生和发展。也有文献指出EV71型HFMD重症组患儿IgM水平显著高于普通组[14-16]，而IgM在t检验中并未表现出统计学差异。同样，MIV分析显示通用型病毒载量和EV71型病毒载量分别列第2和第4位，说明病毒载量在GABP重症化预测模型中具有重要的地位。

利用危险因素构建风险预测模型，可提早发现重症倾向，常见的构建HFMD重症化危险模型多采用logistic回归模型[17-19]。马晓梅等[20-21]首次使用HFMD重症化相关因素构建BP模型，获得了较好的拟合效果。但BP神经网络的算法存在学习效率低、全局搜索能力弱等问题，在模型拟合过程中容易陷入局部极小导致无法收敛。本研究建立的GABP重症化预测模型，在网络性能上，满足均方根误差所需要的系统运行时间，运行步数少于BP模型，解决了BP模型计算量大、耗时长的问题；在预测能力上，灵敏度和特异度显著优于BP模型，AUC达0.8以上，说明GABP模型具有很好的预测能力，能更准确、特异地识别HFMD的重症化风险。

迄今文献报道的HFMD重症化预测模型均未对肠道病毒进行分类，而重症HFMD最常见的病毒为EV71型，因此针对EV71型HFMD构建的预测模型更接近临床实际。本研究基于GABP神经网络建立的EV71型HFMD重症预警模型，为临床医师实现HFMD患儿早期评估提供了一个新工具。