人工智能在肝性脑病风险预测模型中的应用进展

2024-03-05 09:11黄良江毛德文郑景辉王明刚姚春
实用医学杂志 2024年3期
关键词:肝硬化人工智能预测

黄良江 毛德文 郑景辉 王明刚 姚春

1广西中医药大学 (南宁 530200);广西中医药大学第一附属医院 2肝病科,3科研部 (南宁 530023);4广西中医药大学附属瑞康医院 (南宁 530023)

肝性脑病(hepatic encephalopathy, HE)是一个累及多系统、多脏腑的复杂疾病,其临床常表现为意识障碍、行为失常甚至昏迷等。它是各种肝病中常见的并发症之一,其病因和发病机制复杂,同时也容易复发或者加重病情,最常见的形式是由于肝硬化和慢性肝病而发展起来的。HE 的识别、治疗和临床管理一直存在难以突破的瓶颈,面临着诊断不足、发病机制不明确、表型缺乏统一的分类标准等挑战,而且,高死亡风险和与急性加重相关的高成本也给患者的生活质量带来了严重的影响,并增加了社会经济负担[1-3]。过去几十年间,许多研究者都致力于建立HE 风险预测模型,以帮助医生评估患者发生肝性脑病的概率[4]。随着人工智能(artificial Intelligence, AI)技术的快速发展,它在医学领域的应用日益受到关注[5]。最近的研究[6]表明,使用AI 技术对医疗数据进行系统分析可以有利于精准医疗,可使患者受益。人工智能技术具有处理大规模数据和挖掘潜在非线性关系的能力,因此被认为可以提高HE 风险预测的准确性和预测能力[7]。人工智能技术包括机器学习算法、深度学习算法等,它们可以自动学习和调整模型参数,从而提高预测模型的性能[8-12]。本文旨在综述HE 风险预测模型的研究进展,并介绍人工智能在该领域的应用前景,探讨其在HE 风险预测模型研究中的挑战及潜在的未来发展方向。

1 目前评估HE 发病的方法

在临床实践中,传统的HE 风险评估主要基于统计学方法,包括logistics 回归[13]、Cox 比例风险模型等[14-15]。目前,有多种传统的HE 风险评估方式,如Child-Pugh 评分系统、终末期肝病模型评分系统(MELD)等[16],这些模型通过分析临床数据和生化指标等因素,来评估患者发生肝性脑病的概率(表1)。传统模型的建立包括以下几个步骤:特征选择、模型训练和模型评估。特征选择是构建预测模型的关键步骤之一。传统的特征选择方法通常基于专家经验或统计学方法。专家经验方法是根据医生的临床经验和领域知识选择相关的特征。统计学方法包括单变量分析、相关性分析和回归分析等,它们通过分析特征与HE 之间的关系来选择最相关的特征。在特征选择之后,选择的特征被用来训练预测模型。logistics 回归便是常用的模型之一,它基于线性回归模型,并通过sigmoid 函数将线性预测结果转化为概率值。Cox比例风险模型是另一种常用的模型,它可以考虑到生存时间和事件发生之间的关系。这些模型通常通过最大似然估计或梯度下降等方法来估计模型参数。模型评估是判断预测模型性能的关键步骤。常用的评估指标包括准确率、灵敏度、特异度、受试者工作特征(receiver operating characteristic,ROC)曲线和曲线下面积(area under curve,AUC)值等。准确率是模型正确预测的比例,灵敏度是模型正确预测阳性样本的比例,特异度是模型正确预测阴性样本的比例。ROC 曲线是用来评估模型的预测能力的图形,它的横轴代表假阳性率(false positive rate, FPR),纵轴代表真阳性率(true positive rate, TPR)。AUC 值,反映了模型区分正负样本的能力,AUC 值越大,模型的预测能力越好[4]。

表1 传统的HE 风险预测模型Tab.1 Traditional risk prediction model for hepatic encephalopathy

此外,还有一些研究者基于传统算法开发出各类HE 发病风险预测模型,早在2006 年,TAKIKAWA 等[17]在一项急性肝炎相关的前瞻性研究中,纳入164 例患者进行研究,应用传统算法中的logistics 回归分析构建了HE 发病风险预测模型,计算公式为logit(p)=0.084×年龄(Age)+0.129×血清总胆红素(TB)-0.158×凝血酶原时间(%)。在164 例重型肝炎患者中,31%患者在8 周前后出现HE,研究结果表明,高龄、凝血酶原时间延长、高血清总胆红素可作为HE 发病风险预测因素,然而,该研究[17]报道其敏感性较低,说明仅通过纳入因素PT 来代表凝血方面的变化不足以预测HE 的发生。2019 年,LABENZ 等[18]基于既往病史及免疫学研究纳入237 例肝硬化患者,以MHE(minimal hepatic encephalopathy)病史、HE 病史、C 反应蛋白、白蛋白、MELD 评分、血清白细胞介素-6(IL-6)作为预测因素建立预测模型,以验证IL-6 识别HE发生的预测价值,结果显示,加入IL-6 检测对未来180 d 内显性HE 发病的预测性能大幅提高。相比logistics 回归模型,Cox 比例风险模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,研究不同时间点的发病率[18]。TAPPER 等[19]使用人口统计学、临床、实验室和药学数据,基于Cox 比例风险回归模型构建HE 发病风险预测模型,最终预测模型由白蛋白、胆红素、他汀类药物使用和非选择性β 受体阻滞剂4 个预测因素组成,结果显示,43.7%肝硬化患者5 年内发生HE;该模型同时将肝硬化患者发生HE 的风险进行了分层,使用基线数据和纵向数据转换为风险评分,并使用自举验证得到AUC 为0.73。总的来说,传统算法构建的HE 风险预测模型在一定程度上可以预测患者发生HE 的概率,但是它们可能无法整合与HE 预测相关的新式且多样化的数据来源,如基因组数据、代谢组数据、微生物组数据等,这会降低其全面性和及时性,且复杂的计算公式同样限制了其进一步临床应用的可行性。与之相反,AI 具有处理大量复杂数据的能力,使用AI 技术可以克服传统预测模型的一些缺点,从而提高预测的准确性和效率。因此,引入人工智能技术来改进HE 风险预测模型,具有重要的意义。

2 人工智能算法在HE 发病风险预测中的应用

近年来,人工智能在重症监护和肝病学领域的应用显著增加。这与人工智能技术和计算能力以及大数据队列的可用性的重大进步相吻合[22]。人工智能是指通过计算机程序代表人类智能的技术。机器学习算法 (machine learning, ML)是基于统计技术的人工智能技术的一个分支,用于自学和解决问题技能的发展。它通过使用复杂的算法来分析大量数据、识别模式、做出不需要特定代码的预测和决策。常用的机器学习算法包括支持向量机(SVM)[21]、随机森林(random forest)[22]、决策树(decision tree)[23]等(表2)。目前已有一些基于人工智能技术的HE 发病风险预测模型被构建并应用于临床实践。刘宝荣等[24]回顾性纳入479 例乙型肝炎慢加急性肝衰竭患者,采用人工神经网络算法(artificial neural network, ANN)开发了慢加急性肝衰竭发生肝性脑病风险预测模型,利用11 个独立危险因素[包括年龄、肺部感染、腹腔感染、上消化道出血、总胆红素、血钠、血肌酐、国际标准化比值(INR)、白细胞计数、血红蛋白、甲胎蛋白],结果显示,ANN 模型具有较好的危险因素评估预测价值,INR 升高、WBC 升高、Hb 降低和年龄偏大是乙型肝炎慢加急性肝衰竭患者发生HE 的主要危险因素[26]。王旭春等[22]采用SVM、MLP、随机森林以及综合以上3 种算法预测结果的Voting 异质集成分类算法构建肝硬化并发HE 的风险预测模型。结果显示,logistic 回归筛选了7 个风险预测因子,采用重采样技术后的分类模型的预测性能整体上优于不平衡数据模型,以SVM-SMOTE 最优;基于随机森林与支持向量机算法可以弥补传统机器学习在非均衡数据分类问题中的不足,提高模型对于此类数据的分类预测性能。在进行肝硬化并发HE 分类预测时,基于代价敏感的随机森林与支持向量机算法的预测性能高于其模型,而且加权随机森林可提供患者的发病概率,使得HE 发生概率的估计更为直观与高效[21]。程璠等[25]基于潜在类别模型对HE 诱发因素进行特征识别,对具有不同诱因的肝硬化患者进行分类,选择上消化道出血、各种感染、大量使用利尿剂、手术、水电解质代谢异常、便秘、腹水7 个HE 诱发因素进行潜在类别分析,用以划分特征人群来提示高危患者。结果模型拟合指标显示3-cluster 为最佳模型。cluster1、cluster2 与cluster3 分别命名为诱因较多组、腹水利尿组与一般人群组。个体分类后,三组患者肝性脑病发病率差异有统计学意义(χ2= 60.830,P<0.001),诱因较多组、腹水利尿组、一般人群组分别为16.4%、8.8%、2.4%,研究[25]表明,潜在类别模型可用于对不同HE 诱发因素潜在类别的识别,对具有不同诱因特征的肝硬化患者的分类,比较不同特征患者HE 的发病风险,提示高风险患者,为该类患者的护理干预提供依据。谈军涛等[26]纳入我国重庆地区7 家医疗机构共1 498 例肝硬化患者,应用机器学习构建的logistic 回归、随机森林、决策树和XGBoost 算法构建肝硬化发生HE 风险预测模型,比较4 种模型的诊断价值结果显示:随机森林模型AUC 为0.883,综合预测效能优于其余3种模型。然而,该研究为横断面研究,同时未进行外部验证,模型的准确性有待今后进一步验证。另外,有研究者采用弹性网络正则化(Elastic net regularization)方法对某三甲医院消化内科950 例肝硬化住院患者的临床数据集进行变量初筛,再以MMHC 混合算法构建贝叶斯网络,参数估计采用极大似然估计。结果经ElasticNet 特征筛选后11 个变量最终进入模型;MMHC 算法所构建的肝硬化并发HE 贝叶斯网络模型显示:肝肾综合征、电解质紊乱和精神萎靡与HE 直接相关;证明贝叶斯网络能很好地揭示肝硬化并发HE 及其相关因素之间的复杂网络联系,进而有针对性地对肝硬化并发HE 进行预防控制,在分析相关因素上具有更好的应用前景[27]。这些研究证明了利用人工智能方法进行HE 预测建模的益处,与传统评分系统相比,诊断的准确性有所提高。

表2 常见机器学习算法的类型Tab.2 Types of common machine-learning algorithms

3 人工智能在HE 风险预测模型研究领域的挑战及未来研究方向

HE 是一种严重影响个人生存质量的危急重症,故在管理和预防方面亟需准确的预测方法。虽然AI 技术在医学领域得到了广泛的应用,尤其是机器学习方法,可以从大量的数据中提取有用的信息和模式,为临床决策提供支持。然而,开发预测HE 的机器学习模型仍然面临着一些挑战和局限性,主要包括以下几个方面:首先,在模型解释性方面,基于深度学习算法的人工智能并不透明,这在临床实践中可能会产生一定的困惑和不信任[28]。如何提高人工智能模型的可解释性是一个需要解决的问题。出于这个原因,许多研究工作都集中在简化AI 模型,以便临床医生更好地理解,提高使用AI 模型的信心[29]。目前,已有研究者提出开发使用可解释的深度学习模型,如解释型神经网络,它可以提供对模型预测结果的解释[30]。其次,人工智能技术需要高质量和标准化的数据来训练和测试其模型,由于道德、法律、隐私或技术问题,这些数据在现实世界中可能不容易获得,特别是当涉及带有偏见的训练验证数据集和随后的资源分配或决策支持的潜力时。同时,在算法、参数、特征或数据集的选择,人工智能技术可能会在其模型中引入偏差或错误,这可能会影响其预测的有效性和可靠性[31]。特别值得一提的是,目前已有一些基于机器学习的HE 预测模型被提出,但是这些模型通常只考虑了一些单一或有限的预测因子,如血清氨、血清钠、肝功能指标等[18]。然而,HE 的发生是一个复杂的多因素过程,可能涉及遗传、代谢、免疫、营养、微生物、药物等多个方面[26]。因此,未来的研究应该探索更多的潜在预测因子,从多领域候选预测因子中为HE预测评分,如基因多态性、代谢组学、微生物组学、药物暴露历史等,并利用机器学习方法从中筛选出最具有预测价值的因子,构建更加准确和全面的HE 预测评分[32]。我们还可以使用个性化评估比如年龄,从而促进对HE 的早期干预和管理。不同的患者可能存在不同的HE 发病风险和临床表现,这可能与患者的个体差异有关,如年龄、性别、基础疾病、合并感染等。应该考虑患者的个体特征,为每例患者提供个性化的HE 风险评估和干预建议[33]。例如,根据患者的年龄分层,为不同年龄段的患者制定不同的阈值和策略。这样可以提高HE 的早期识别和治疗效果,降低患者的死亡率和并发症。如今,由于AI 技术具有更强的特征提取和建模能力,HE 风险预测模型的研究在人工智能技术的参与下取得了显著的进展,故关注HE 发病风险预测模型的的研究越来越多,但我们也应该注意到,尽管研究者报道了出色的模型性能结果,但这些模型很少受到其他研究人员的关注,用于实际临床实施的研究只是少数,也很少有研究来进一步验证它们的稳定性[26-27]。此外,关于后续临床应用的报道很少。再者,这些研究中很多都是在回顾性诊断的患者数据集上进行训练和验证的,而且没有充分比较人工智能优于现有决策工具和临床诊断的能力[22]。因此,这些模型应通过临床试验进行广泛的前瞻性验证,以更好地指导HE 治疗。最后,大多数基于机器学习的HE 预测模型都是基于小样本或单中心的数据进行开发和验证,这可能导致模型存在过拟合或偏倚的问题,限制了模型在不同人群或地区的应用[34]。鉴于此,未来的研究应该利用更多来源和规模更大的数据,如多中心或国际合作的数据,对模型进行充分的训练和测试,并在不同的人群或地区进行外部验证,以评估模型的稳健性和泛化能力。这样可以提高模型的信度和效度,增加模型在临床实践中的可用性和推广性[35]。

4 总结与展望

随着计算能力的提升和算法的进一步优化,预测模型将能够整合和分析更加多样和大规模的医学数据,如临床指标、影像学资料、基因组学信息等,通过AI 技术的集成分析,从中发现更多隐藏的风险因素和病情变化规律,大幅提升模型的准确度和稳健性,提供更全面的风险评估。另一方面,持续涌现的新兴AI 技术也为HE 风险预测带来新机遇。例如,增强学习可以实现模型的动态更新和自我完善,使预测细致适应个体变化;迁移学习可以充分利用其他疾病领域的数据和经验,缩短模型的训练周期;多任务学习可以组合相关的预测任务,实现风险评估的全面性和一致性。同时,结合自然语言处理和情感分析等技术,我们还可以利用社交媒体数据和个人行为数据,精准地识别潜在的心理和环境因素,充分利用这些前沿技术,有望推动HE 风险预测向着更个性化、动态化和精细化的方向发展。随着这些技术的发展,将需要适当的改进和透明度,在此过程中,它们应该增强和补充提供者的决策,而不是取代传统。只有在保证安全可控的前提下,HE 风险预测模型才能真正被临床采纳,为患者提供价值。未来,我们可以期待这些创新的大数据技术与AI的结合,为HE 的早期诊断和预防提供更加有效的支持,大大提高患者的生活质量和健康水平。

综上所述,人工智能技术为HE 的预测提供了新的可能性和机遇,但今后还需要解决可行性、可解释性、可推广性和公平性等问题,以便更安全地将这些模型应用于日常临床实践,这需要医学和信息技术团队的密切协作,和谐发展人工智能在医疗健康领域的应用,以提高HE 预测模型的性能和实用性,为HE 的早期诊断和治疗提供更有力的支持,及时、高效地进一步加强医院资源的有效管理。

猜你喜欢
肝硬化人工智能预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
肝硬化病人日常生活中的自我管理
2019:人工智能
人工智能与就业
防治肝硬化中医有方
数读人工智能
不必预测未来,只需把握现在
下一幕,人工智能!