TRIPOD 规范解读及对护理研究的启示

2020-11-04 06:27覃盛媚黄海韵
护理研究 2020年20期
关键词:条目变量因子

李 琪,周 洁,覃盛媚,黄海韵,吴 静

(上海中医药大学护理学院,上海201203)

在医学领域中,“预测模型”通常被用来预测个体疾病的发生及转归,以便指导医务人员制定合理的治疗方案。“预测模型”的构建最早源于心血管疾病研究领 域[1],始 于1948 年 的 美 国Framingham 心 脏 研 究(Framingham heart study,FHS),1961 年首次提出疾病“危险因素”概念[2],也是当前众多疾病预警与干预模式研究的基石。随着大数据及临床循证护理理念的不断深化,预测模型研究逐渐成为近年来护理领域的研究热点,化疗副反应[3]、压疮[4]、疼痛护理[5]、衰弱评估在病人不良健康结局或手术风险预测[6⁃7]等方面凸显价值。然而,评估模型开发与验证相关研究的报告质量[8⁃9]发现仍存在诸如缺失数据的处理、模型构建的策略、使用小数据集建模等[10⁃13]问题,导致很少有预测模型被运用于临床实践中。个体预后和诊断的多变量预测模型透明报告(transparent reporting of a multivariable prediction model for individual prognosis or diagnosis,TRIPOD)规范的引入使得多变量预警研究更为严谨,而其在护理领域的应用仍较局限。现从TRIPOD 规范的产生背景、核心内容等方面进行介绍,并以老年衰弱的发生及不良事件的预警研究为例对护理领域预测模型的研究和不足进行综述,以期为临床医护人员关注预测模型,提高报告质量提供参考。

1 TRIPOD 规范概述

TRIPOD 是指导预测模型研究如何进行规范化报告的清单,提高临床预测模型研究的报告质量及可重现性。2011 年6 月,24 名统计学家、流行病学专家及期刊编辑组成的研究小组在英国基于文献编制项目清单并通过会议讨论、邮件征集对其进行缩减和修订,形成了TRIPOD 指南[14],包括22 个条目,涉及标题和摘要(条目1 和条目2)、背景和目标(条目3)、方法(条目4~条目12)、结果(条目13~条目17)、讨论(条目18~条目20)及其他信息(条目21 和条目22)。TRIPOD 规范条目如图1 所示。

图1 TRIPOD 规范条目

2 TRIPOD 规范的核心内容

2.1 多变量预测模型的开发 开发预测模型包括识别预测因子、分配预测因子相对权重、通过校正和区分评估模型预测效果,继而采用内部验证技术优化模型、校正模型的过度拟合[15]。TRIPOD 强调模型建立应明确研究对象和结局事件的数量、定义。研究表明,传统的模型开发方法已被应用于实践,如专家共识、Delphi技术或文献综述等,专家通过使用这些方法决定模型应包含哪些潜在预后因素、如何分配预测因子的权重,从而反映预测因子对结局的预测预后强度。然而,上述方法因主观选择的偏差性和预测效度不佳而屡受质疑[16]。目前,数据建模常用的方法有Cox 比例风险函数、Weibull 回归函数和Logistic 回归模型[1],其中常用的是Cox 比例风险函数,如著名的Framingham Risk Score、Reynolds、QRISK 等心血管病发病风险预测模型皆基于此方法[17]。随着大数据理念的飞速发展,也有研究尝试采用决策树、故障树分析法、层次分析法等构建预测模型。多变量预测模型的建立规范如图2所示。

图2 多变量预测模型的建立

2.2 多变量预测模型的验证 模型的验证是指对模型的性能指标(区分度、校准度)进行考察的过程[18]。根据考察过程中是否使用预测模型的开发队列数据,分为内部验证和外部验证。内部验证是检验模型开发过程的可重复性,包括随机拆分验证、交叉验证、Bootstrap重复抽样以及“内部−外部”交叉验证。外部验证考察的是模型的可移植性和可泛化性,TRIPOD 准则第15项明确要求,模型必须完整报告所有回归系数、模型截距或者基础生存概率,以确保对个体进行风险预测[19⁃20],常见形式包括时段验证、空间验证以及领域验证。TRIPOD 要求模型验证需描述预测值的计算方法及模型验证后的更新内容,并比较验证数据集和建立数据集在重要变量上的分布差异,如人口学资料、预测指标和结局指标等。此外,模型应用前,应进一步验证该模型在非参与模型建立人群中的预测效果,观察根据模型确立的风险因素建立的干预措施对临床问题产生实际影响,若该预测模型具备良好的识别和预测潜在风险的价值,则可在相应的临床实践和公共卫生领域得以应用推广。多变量预测模型的验证规范如图3 所示。

图3 多变量预测模型的验证

3 TRIPOD 报告规范对护理研究的启示

3.1 衰弱病人不良健康结局的预警研究现状 衰弱是指老年人由于多个生理系统功能储备能力下降,机体易损性增加,维持自稳态能力降低及抗应激能力减退,面对较小刺激也可致一系列临床不良事件发生的一种常见老年综合征[21],能够量化不良健康结局风险[22]。研究表明,衰弱与跌倒、住院、疼痛、失能、残疾以及最终死亡等高风险相关,而使用预测数据挖掘可帮助发现潜在的危险因素,作为临床决策支持系统,为医护人员提供病人可能发生的结局并据此给予风险评估和预防干预[23⁃25]。风险预测模型在广泛实施之前应经历识别预后因素以建立模型、在相似人群(内部验证)和/或不同人群(外部验证)中测试模型以及评估对病人结局、医师决策或成本的影响3 个阶段,最终促使临床医护人员准确识别风险因子,个体化给予危险人群干预措施。Sokoreli 等[26]评估衰弱和社会支持对心力衰竭病人住院预后的预测能力,报告遵循TRIPOD指南使用临床变量对模型进行比较,通过Bootstrap 重复采样对模型的判别性能进行内部验证,结果表明包含衰弱、家庭支持等指标的模型较仅有临床变量的模型曲线下面积大,可见衰弱的评估可提高对病人入院30 d 预后的预测性能。但该研究的局限在于未对模型进行外部验证,其推广性仍需进一步探讨。衰弱指数可用于预测老年人跌倒、残疾、骨折和死亡[27],即在已知不良健康结局预测因子情况下,根据TRIPOD 要求,研究应对现有模型进行验证或比较。司华新[28]研究表明,利用衰弱筛查工具可预测老年衰弱病人跌倒、失能等不良健康结局的发生;Ensrud 等[27]比较两种不同衰弱指数对不良健康结局的预测性,随访3 132 名男性老年人,利用曲线下面积对包含骨质疏松性骨折研究(SOF)指标的模型与心血管健康研究(CHS)指标的模型进行比较,便于临床使用过程中选择更佳的模型,发挥模型建立的临床意义。衰弱具有可逆性,作为老年人综合健康状况的评价指标对多种不良健康结局的预测作用可促进风险防范的早期实施和干预。此外,构建危险因素或预后预测模型在对病人的护理风险评估方面发挥着至关重要的作用,如根据预测因子及时采取干预措施以有效预防骨折[29]、深静脉血栓[30]、尿失禁[31]等结局,研究对象多为老年人,依托养老院、疗养院的研究逐渐增多[32]。

3.2 现存不足与误区 结合TRIPOD 规范,发现既往相关预测模型的研究文献报告尚存在一定的不足和误区,其中常见的、共同的问题多表现在样本量、缺失数据的处理、预测因子的选择策略不佳及缺乏对模型的验证等方面。建立模型需要有可靠的数据样本( 通常是代表性较好的大样本前瞻性队列研究),能够较准确地预测未来某段时间内( 通常为10 年) 疾病的发病概率,且对样本量进行详细的解释以保证最终模型的可靠性。如Zaslavsky 等[33]比较了常用的妇女健康倡议(WHI)和CHS 衰弱表型工具对老年妇女健康倡议临床试验参与者跌倒、髋部骨折和死亡的预测能力,研究基于大样本并对结果进行仔细判断,同时长期随访的完整性保证了结果的稳定性。尚有不少研究的样本量不足且缺乏合理的解释,且前瞻性队列研究有限[5,34]。TRIPOD 要求研究报告中应描述缺失数据的处理手段和插补方法的细节,在缺乏数据的情况下,由于有效样本量少可能对预后估计产生偏倚。理想情况下,应使用先进的技术进行数据处理。如Hassler 等[35]针对现有数据库,利用数据挖掘技术探索寻找衰弱的危险因素并建立预测模型,研究仅分析了一个队列的474 例病人,包括284 个变量,故只能粗略地评估模型性能。然而,该研究表明利用数据挖掘技术对不完整、不平衡的医疗数据进行整理、估算和特征选择等来寻找预测因子、建立预测模型是可行的。此外,模型的预测因子应能够从某生理机制或途径得以合理的解释,当候选变量较多时,可参考既往研究已公开报道的对结局事件有独立作用的变量作为重点的候选变量以供备选,而预测因子的选择策略仍是研究的问题之一,如Kojima 等[36]利用基于综合监测系统的高质量前瞻性数据建立老年衰弱病人跌倒预测模型,其未能获取并控制如认知功能、乙醇使用或高危药物使用等重要的潜在混杂因素。Bromfield 等[37]研究中也存在未能获取体重减轻、步态速度和握力等衰弱相关指标的局限。现有的疾病风险预测模型在自变量选择上除根据基线资料组间单因素分析结果及临床背景,鲜少考虑变量之间的交互作用,也未进行自变量的多重筛选,继而导致模型自变量之间可能存在共线性,影响模型的预测能力[38]。有学者提出采用关联规则挖掘技术或Lasso回归,有望改善模型自变量选择的潜在交互问题。预测模型研究是为了量化使用预测模型对医护人员的决策或直接对病人健康结果的影响,而非单纯地使用模型[39]。尽管大部分研究对模型进行了校正和调整,且显示具备良好的拟合性,但其是否被应用于临床及对临床病人结局的改变长期效果仍不清晰,无法确定这些模型在临床实践中的价值。

4 研究展望

疾病预防从宏观和微观层面可以分为公共卫生防控、个人疾病筛查和健康管理[40],卫生保健提供者和决策者越来越多地建议在临床实践中使用预测模型,为临床路径的各阶段决策提供信息[41⁃42],这无疑促进了人类疾病的预防和健康管理。未来的研究应根据TRIPOD 规范报告模型的开发与验证,应用合适的预测因子选择策略,适当处理缺失数据和连续预测因子,避免过度拟合。在模型的呈现上,Nomogram 只是一个回归模型的可视化呈现方法,本质跟普通的回归方程式一样,故应选择适合表达及便于理解的呈现方式[43]。目前,数据挖掘技术正在成为医学界和临床工作者的重要分析工具,便于对病人和临床研究数据的二次利用,有助于提高卫生保健系统的效率和效力。

综上所述,只有在充分和透明的报告下,才能揭示研究的优缺点,从而促进模型在临床环境中的应用,有助于实现对病人照护服务的个体化,便于给予病人实时、高效的服务,落实国家促进护理服务业改革与发展政策。

猜你喜欢
条目变量因子
我刊2021年影响因子年报
寻求不变量解决折叠问题
抓住不变量解题
一些关于无穷多个素因子的问题
影响因子
《词诠》互见条目述略
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
扮靓爱车拒绝潜伏危险因子
分离变量法:常见的通性通法
对县级二轮修志采用结构体式的思考