经皮冠状动脉介入治疗术后复发预警模型研究*

2022-08-06 00:46王颖晶倪连超
医学信息学杂志 2022年6期
关键词:机器样本预测

王颖晶 倪连超

(上海交通大学医学院附属仁济医院信息中心 上海200127) (万达信息股份有限公司 上海201112)

陈珊黎 邵维君 韩 刚 丁粉华 郑 涛

(上海交通大学医学院附属仁济医院信息中心 上海200127)

1 引言

1.1 研究背景

经皮冠状动脉介入治疗(Percutaneous Coronary Intervention,PCI)已成为急性冠脉综合征(Acute Coronary Syndrome,ACS)主要且有效的治疗方法。随着PCI技术的广泛应用和疾病复杂多变性的增加,PCI术后冠脉再狭窄成为临床难点,也是影响患者预后的主要因素。目前机器学习已逐渐应用于医学辅助诊断领域[1-2],机器学习与现代医学融合可用于医疗决策和辅助诊断,能够为临床医务人员提供帮助,为患者提供便利。

1.2 相关研究

当前关于PCI预后的研究主要集中在相关危险因素评估以及不良事件或并发症事件发生预测方面。程诚和王鑫[3]基于行PCI术治疗冠心病合并2型糖尿病患者的血压、血糖、血脂、支架情况、Th1及Th2细胞因子水平等,采用Logistic逐步回归模型分析PCI术后发生支架内再狭窄的影响因素。吴欢、薛万国和应俊等[4]利用随机抽样和合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)进行样本均衡化处理,再分别利用分类回归树算法(Classification And Regression Tree,CART),C4.5条件树,AdaBoost,Bagging,随机森林(Random Forest,RF)和朴素贝叶斯算法(Naive Bayes) 6种机器学习方法构建PCI术后12个月主要不良心血管事件的风险预测模型。宋玲花、李保和韩慧媛[5]对PCI术后患者病历资料、定期复诊资料和电话随访资料进行分析,建立Cox比例风险模型和预后指数方程,实现对具有不同危险因素的冠心病患者的PCI术后复发风险预测。

1.3 研究内容

上述模型均需要再次行有创经冠脉造影检查才能予以诊断PCI是否复发。针对这一问题,可尝试使用术后随访的常规无创性检验结果和患者基本信息等数据,运用机器学习算法对PCI术后复发进行预测。本文主要基于机器学习算法的二分类模型,构建一种多模型融合的Stacking算法,并通过医院真实样本数据对患者PCI术后的复发情况预警开展研究。

2 数据样本

2.1 数据来源

选取仁济医院2015-2018年期间收治、接受过冠状动脉支架植入术且具有完整记录的患者作为样本集,并以该样本集的医疗电子病历信息数据作为数据源开展研究。

2.2 纳入和排除标准

根据专家知识制定PCI术后复发患者纳入和排除标准,在心内科住院和门诊数据中存在多条手术记录的患者即为复发患者,而仅有1条手术记录且此次手术时间距离2021年已超过3年的患者被认为没有复发的患者。基于该标准共采集复发患者即正样本402条,没有复发患者即负样本2 509条,正负样本共计2 911条。通过患者唯一标识,关联得到患者的基本信息、门诊和住院信息以及检查、检验项目等作为分析因素。其中针对多次手术的患者取其最后一次手术信息;针对多次检查和检验的情况以手术时间作为参考时间点,手术前3个月内是否存在检验检查记录作为纳入标准,取该时间段内最后一次检验检查项目作为采纳分析数据。

2.3 分析因素

分析因素主要包括患者基本信息、临床就诊信息以及检验检查资料等,通过医院信息系统(Hospital Information System,HIS)中的患者病历及其门诊和住院检查数据获得,主要包含以下3个方面,共计263个特征。一是检验检查特征:住院和门诊中常见的常规检验检查项目,如全血细胞分析、尿液分析、血气分析等258个特征。二是患者基本特征:年龄、性别、血型3个特征。三是手术相关特征:手术完成时间、手术进行总时长两个特征。

3 基于机器学习的PCI术后复发预警模型

3.1 机器学习有监督分类方法

3.1.1 常用方法 基于上述分析因素借助机器学习方法构建PCI术后复发预警模型。通过纳入和排除标准确定复发患者和未复发患者,得到明确的样本类别,因此可构建有监督分类方法进行PCI术后复发预警。当前机器学习有监督分类方法较多,常用方法包括逻辑回归(Logistic Regression, LR),支持向量机(Support Vector Machine, SVM),K近邻(K-Nearest Neighbors, KNN),RF,极限梯度提升(Extreme Gradient Boosting, XGB),Light Gradient Boosting Machine(LightGBM),Categorical Boosting(CatBoost)等。其中RF、XGB、LightGBM和CatBoost均为以决策树为基模型构造的集成学习方法,适合结构化数据建模并具有较强的泛化能力,而LR、SVM以及KNN与前几种方法具有较大差异,构造原理也不同。

3.1.2 各类方法对比分析 逻辑回归受制于模型的线性结构,无法对非线性信息进行准确刻画,同时也无法抽取多个特征间的组合关系,导致使用者必须人工设计复杂特征集合来提升模型预测精度。支持向量机在大规模数据集上难以应用,当样本数量较大时模型训练会占用大量内存和运算时间。K近邻的缺点也较为明显,首先其在预测过程中运算量较大,需要计算到每个训练样本的距离,其次模型可解释性较差,再次模型鲁棒性较差,容易受到错误数据的影响。随机森林有很强的实用性,但是在处理某些噪声较大的数据时会出现过拟合。XGBoost、LightGBM和CatBoost均为Boosting算法梯度下降树的优化算法。但是这些方法使用门槛较高、模型参数多,在进行参数优化时较为复杂。

3.2 模型构建方法

为提升PCI术后复发预测精度,基于上述7种方法构建一种多模型融合的Stacking算法。Stacking算法能够结合多种不同类型的有监督分类方法作为基学习器,并在此基础上再构建一个分类器,预测未知样本类别。该方法最显著的优点是能够明显降低模型方差从而有效提升模型预测精度;此外能够纳入任何有监督分类方法作为基分类器,不受方法本身构造原理的约束。因此该方法在实际应用中对计算资源要求更高,针对同等规模的数据集,模型训练时间也数倍于单个模型。具体的Stacking算法主要分为两层,第1层是由7种不同的基学习器组成,包括LR、SVM、KNN、RF、XGB、LightGBM和CatBoost。第2层是将第1层输出作为新特征输入到元学习器并进行训练,形成最终的预测模型,见图1。

图1 Stacking算法架构

4 实验与结果分析

4.1 实验环境和数据预处理

4.1.1 实验环境 为探究基于机器学习的PCI术后复发预警模型的有效性,基于纳入的2 911条样本展开实验和分析。借助Python及其开源的机器学习框架scikit-learn等[6-8]实现上述8种算法。

4.1.2 数据预处理 由于部分方法对特征分布非常敏感,为更准确地评估各算法的性能表现,需要对数据进行预处理。首先,对数据集中每个特征均进行标准化处理,以此消除特征的量纲。其次,考虑到除XGB、LightGBM、CatBoost 3个较新算法外,其他传统算法均无法对缺失值进行合适处理,因此对数据中的缺失值以-1数值进行填充。最后,为了模型训练过程中更加平稳,防止正负样本严重失衡对模型性能损伤,对原始数据集中的负样本进行下采样处理,最终正负样本比例为1∶2。

4.2 实验评估方法

为更好地评估算法表现及其泛化性能,使用五折交叉验证方式进行模型验证。保证正负样本比例在训练与测试过程中保持一致,并采用随机划分方式,以避免人为因素干扰。针对非均衡数据集,模型评估衡准主要采用受试者操作特征曲线下面积(Area Under the Curve, AUC),真正率(True Positive Rate,TPR),假正率(False Positive Rate,FPR)和F1值,同时为了避免随机划分可能引入的偏差,以独立的随机划分5次后的评估均值为最终结果评价衡准。各项评估指标的具体计算公式为:

(1)

(2)

(3)

(4)

(5)

其中TP、TN、FP、FN分别表示正样本被正确预测、负样本被正确预测、正样本被错误预测、负样本被错误预测的样本数。

4.3 实验结果分析

模型参数通过多次实验效果比较进行选取,见表1。对于其他未列举的模型参数,其取值均采用计算框架中的默认值。对比本文的Stacking算法以及其他7种有监督分类方法开展实验情况可见,本文构造的Stacking算法性能最佳,AUC达到0.901,TPR达到78.2%,FPR为14.1%,F1值为0.744。

表1 算法与其参数的取值范围

4.4 指标因素分析

4.4.1 分析方法 鉴于模型输入变量较多,针对这些指标因素进行重点评估和筛选具有重要研究意义。通过筛选对模型具有重要影响的变量,挖掘对疾病具有提示性的因素,能够为临床研究者提供更多依据以及新的研究思路。为了对建模指标因素进行解读,选取预测精度较高的Xgboost、LightGBM和CatBoost 3种模型,分别计算指标因素的特征重要性权重。对于这3种基于决策树的模型,由于树模型在每一折交叉验证中均对训练集学习得到一个预测模型,同时也得到不同特征的重要性权重,因此将每一折的结果进行平均即可得到其对整体数据特征重要性的评估。

4.4.2 分析结果 通过计算特征重要性得到3种模型各自排名前20的特征重要性权重。结果显示载脂蛋白B对于PCI术后再狭窄的预测评估至关重要,电导率、标准碳酸氢根浓度、促甲状腺激素、糖化血红蛋白A1C等指标也有显著影响。因此后期随访中相关检验检查如血脂全套、尿液分析、血气分析、甲状腺功能5项等需要重点关注。

5 结语

通过机器学习有监督分类模型,结合检验检查、患者基本信息和手术信息,对PCI术后复发进行预测,构建一种基于Stacking算法的PCI术后复发预测方法,实验结果显示该方法的AUC达到0.901、TPR达到78.2%、FPR低至14.1%,F1值达到0.744。此外特征重要性排序结果显示载脂蛋白B、电导率、标准碳酸氢根浓度等指标是对PCI术后再狭窄预测评估的关键因素,对PCI术后再狭窄有重要的提示意义,从而为PCI术后复发预测的进一步研究和相关医疗资源的合理使用提供参考。尽管相较于单个基模型,Stacking算法能够降低模型方差,较大地提升模型预测精度,但该方法存在几点不足有待改进。第一,当建模数据较多时,该方法相比单个模型需要更长的训练和预测时间;第二,由于集成多个模型的预测结果作为特征数据,该方法缺乏对原始指标因素的解释能力,仅凭借该方法难以对临床指标进行分析和筛选;第三,该方法的模型构建较为复杂,考虑到基模型数量较多且每种模型都有多个超参数,模型参数的设定和优化是需要多次迭代和调试进而达到最优,该过程较为繁琐、耗时。针对上述问题,在未来工作中将进一步优化方法流程,在保证模型泛化能力的基础上提升模型训练效率,增强模型的可解释性及易用性。

猜你喜欢
机器样本预测
无可预测
机器狗
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
机器狗
用样本估计总体复习点拨
未来机器城
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本