老年人跌倒风险预测模型研究进展

2023-01-02 00:26岳跃学贾玉玲王秀红
护理研究 2022年16期
关键词:灵敏度量表预测

岳跃学,贾玉玲,王秀红*

1.贵州医科大学护理学院,贵州 550025;2.贵州医科大学

跌倒是65 岁及以上老年人创伤和死亡的主要原因[1]。中国健康与养老追踪调查显示,城市老年人2 年跌倒发生率为20%左右,70 岁以上的中高龄老年人跌倒发生率高于低龄老年人[2]。跌倒会导致许多负面后果,包括严重受伤、行动能力下降和丧失独立性;同时,也会让老年人产生焦虑、抑郁、跌倒、恐惧等不良情绪,影响身体康复[3],给家庭和社会造成沉重的精神负担和经济负担。研究显示,美国2015 年与跌倒相关医疗费用超过500 亿美元[4];中国估计每年有2 600 万老年人发生跌倒,需要约50 亿元的直接医疗成本和600 亿~800 亿元的社会成本[5]。国内外研究指出,使用合适的测评工具对老年人跌倒风险进行评估,有助于制定针对性干预措施,以减少老年人跌倒的发生,对提高老年人生存率和生活质量,降低医疗和照顾负担具有重要意义[6-8]。但国内外使用的老年人跌倒风险预测工具繁多,各种工具有效评估指标各异,评估内容及适用人群不统一,造成预测结果与老年人真实跌倒现况存在差距。鉴于此,本研究对目前国内外常用的跌倒风险预测模型进行总结、分析,以期为国内临床、社区跌倒护理实践和跌倒风险预测模型的构建与验证提供思路。

1 风险预测模型概述

风险预测模型研究的目的是估计一个特定的个体概率结果,分为诊断模型(症状或疾病是否存在)和预后模型(一个特定的结果是否将在未来发生)[9]。目前,预测模型的开发、验证和更新是临床研究的热点和重点[10]。传统风险预测模型中的Logistic 回归模型可以直接对跌倒评估量表测量结果进行分析[11]。随着更大规模、更为复杂的医疗数据的产生及人工智能应用的兴起,人们逐渐借助可穿戴设备和机器学习技术(可以处理大量、非线性和高维数据)构建预测模型,包括决策树、神经网络模型和深度学习等[10,12]。预测模型的评价主要包括区分度、临床有效性、校准度,其中区分度较为常用,常见指标为C 指数,即受试者工作特征曲线下面积(area under curve,AUC)、灵敏度、特异度和约登指数等[13]。灵敏度为真阳性率,反映了将实际有病的人正确区分为阳性的能力;特异度为真阴性率,反映了将实际无病的人正确区分为阴性的能力;约登指数为灵敏度与特异度相加减去1,反映筛查试验的真实性[14]。C 指数为0.50 显示该模型有预测作用,0.51~0.70 显示该模型为较低区分度,0.71~0.90 为中等区分度,高于0.90 为高区分度[15]。

2 常用跌倒风险预测模型

常用的老年人跌倒风险预测模型包括跌倒评估量表、可穿戴设备和机器学习。各种方法可单独使用或联合使用,目前,最常用的仍是量表评估预测法,但越来越多的学者尝试引入可穿戴设备和机器学习构建跌倒风险预测模型。通过可穿戴设备直接对量表评估结果进行处理或与机器学习相结合,开发跌倒风险预测平台和系统,在不同场所中区分高跌倒人群和筛选高危跌倒风险因素,对跌倒高危人群进行持续的跌倒风险监测和预警,为医疗机构和社区卫生服务人员开展跌倒干预精准化方案提供有力支持。但上述方法各有利弊,尚需更多的队列研究来验证所构建模型的有效性。

2.1 跌倒风险评估量表 该量表因其便利性和可操作性,被国内外学者广泛用于预测、评估老年人跌倒风险的重要工具。目前,国内外老年人跌倒评估工具种类繁多,包括:①跌倒风险综合评估量表,如Morse 跌倒风险评估量表(Morse Fall Seale,MFS)、Hendrich Ⅱ跌倒风险评估量表(Hendrich ⅡFall Risk Model,HFRM)、约翰霍普金斯跌倒风险评估量表(Johns-Hopkins Fall Risk Assessment Scale,JHFRAS)、老年人跌倒风险评估量表(Fall Risk Assessment Scale Elderly,FRASE) 和托马斯跌倒风险评估量表(StThomass Risk Assessment Tool,STRATIFY)等;②跌倒相关心理评估量表,如特异性活动平衡自信量表(Activities-Specific Balance Confidence,ABC)和跌倒效能量表(Falls Efficacy Scale,FES);③平衡功能量表,如Berg 平衡量表(Berg Balance Scale,BBS)和功能性伸展测试(Functional Reach Test,FRT)等;④跌倒预防知信行问卷[16]。大多数量表使用信效度描述有效性,在使用地点和人群差异较大时,量表的推广适用度受限。因此,越来越多的学者建议使用灵敏度和特异度等有效性指数对量表预测有效性进行量性分析,以进一步确定针对特定人群更有效的评估工具[17]。跌倒风险评估量表中使用较为广泛的是MFS、HFRM、JHFRAT 和BBS。学 者Cho 等[18]对MFS、HFRM、JHFRAT 3 个量表的预测能力进行比较,发现虽然JHFRAT 的准确 性(74.55%)最 高,MFS 的灵敏度(59.28%)最高,但HFRM 的AUC 为0.742,高于MFS(0.641)和JHFRAT(0.708),约登指数(0.35)也高于MFS(0.24)和JHFRAT(0.19),是3 个量表中预测能力最好的跌倒评估工具。此外,该研究显示最重要的跌倒风险因素为步态、头晕或眩晕、精神状态变化和跌倒史,建议急症机构在评估病人跌倒风险时将上述因素纳为重点考虑因素。该研究是在一家以收治急症病人为主的三级教学医院进行的,且该研究未纳入已知与跌倒密切相关的年龄和性别作为风险因素,其研究结果是否能用于其他医疗环境仍需甄别。一项Meta分析对26 种常用于预测老年人跌倒风险的评估工具进行比较,提出尽量选用高灵敏度、高特异度和低异质性的量表作为评估工具[19]。目前,国外使用的大多数跌倒评估工具汇总灵敏度和汇总特异度均<0.6,且研究间异质性较高,表明目前用于老年人的跌倒风险评估工具的预测有效性不足,不能准确地预测老年人跌倒。该研究在对各评估量表进行预测有效性比较后得出,BBS 的 特 异 度 最 高 为0.90,AUC 为0.97,因 此,BBS 被认为是目前识别低跌倒风险老年人最有用的工具。此外,该研究建议在使用量表预测老年人跌倒风险时,联合使用两种量表可更好地评估多因素所致老年人跌倒特征并能最大化发挥单一量表在跌倒风险预测中的作用。

2.2 可穿戴设备 目前,临床对老年人跌倒的评估主要依赖相关量表的主观测量,此法受临床时间和成本限制,且具有天花板效应,一定程度上限制了跌倒风险的预测效果。近年来,国内外学者积极探索更客观的评估方法并将其与具有更佳成本效益的传感技术和软件通信技术结合,开发出一系列可进行动态跌倒风险评估、监测并发送警示信息的可穿戴设备。该设备体积较小、佩戴方便、成本低,主要由人体活动检测仪(activity monitors,AM) 和 运 动 检 测 仪(movement monitors,MM)两部分构成,通过惯性传感器和加速度计、陀螺仪和磁力计等设备结合,可以更客观、高效、精确地采集人体在平衡控制中各环节空间的运动学参数,并实时、快速进行数据分析及传输,广泛用于老年人平衡和步态受损程度测量、轻微平衡和步态受损灵敏度测量和日常生活移动能力的测量中[20];甚至能通过生物反馈装置,发送躯干倾斜信号等帮助老年人及时调整身体姿势,以预防跌倒。一项研究通过开展226 项测试对比基于可穿戴设备的自动算法与理疗师的观察结果,提出使用可穿戴设备自动算法的跌倒风险评估与观察数据有高度一致性(范围78.15%~96.55%)和较高程度匹配的有效性[21]。与理疗师的观察结果相比,基于可穿戴设备的自动算法的跌倒风险预测有效性分别为:6 min 步行测试准确性为94.64%,灵敏度达97.29%,特异度达89.47%;计时起立测试准确性为94.64%,灵敏度为77.77%,特异度为97.87%;30 s 坐立测试准确性为76.78%,灵敏度为86.20%,特异度为66.66%;4 阶段平衡测试准确性为76.78%,灵敏度达95.45%,特异度达8.33%。总体而言,基于可穿戴设备的跌倒风险自动评估算法可将人为错误风险降至最低,可用于代替较为费力的人力观察评估方法。可穿戴设备可提供准确、廉价且易于管理的客观跌倒风险评估,是一种可行的跌倒风险评估工具。目前,可为老年人提供准确的跌倒风险诊断的4 种主要传感技术为惯性传感器、视频/深度相机、压力传感平台和激光传感[22]。由于其广泛的普及性、不断降低的成本、内置的传感器、计算能力和通信能力,基于安卓的个人设备,如智能手机、智能手表等正被视为可穿戴跌倒检测系统的一项有吸引力的技术。学者Casilari 等[23]基于智能手机和智能手表(均配备嵌入式加速度计和陀螺仪),在开发的安卓应用程序中实现了不同的跌倒检测算法,以区分跌倒与病人日常生活的常规活动。当两个安卓设备同时独立检测到跌倒时,即会假设跌倒已经发生。结果表明,两个检测设备的联合使用明显提高了系统避免误报警或“误报”(那些被误识别为跌倒的传统运动)的能力,同时保持了检测决策的有效性。基于传感器的姿势摇摆、功能活动、迈步和行走的跌倒风险评估可以区分跌倒者和非跌倒者[24-25]。Marano等[26]通过智能手机应用程序对帕金森病病人进行为期4 周的平衡和定时起身走动数据监测以预测跌倒发生情况。该研究发现帕金森病病人跌倒发生情况与其站立时间有关,建议临床工作者在将预防跌倒的重心从步幅、步态中转移到病人从坐位到站立的姿势转换(postural transitions,PTs)中去。Zhou 等[27]采用可穿戴设备测量不同神经系统疾病病人的时空步态特征来预测跌倒,结果表明偏最小二乘法(PLS-DA)分类模型对所有3 种步态任务(ST、DT1 和DT2)表现良好,在AUC 下的分类性能评估区域分别为0.7,0.6 和0.7。该研究得出具体的步态特征差异,提出步数、足趾离地时的足底弯曲和足跟撞击时的足踝背屈、步幅长度、步幅持续时间、步速和站立时间是区分跌倒者和非跌倒者的敏感变量。跌倒者与非跌倒者相比,步速和节奏较慢,步态变异性高,空间步态模式受损,为优化特定跌倒预防干预措施提供了具体的方向。虽然,可穿戴设备为跌倒风险预测提供了便利,但测量参数、评估工具、传感器位置、运动任务和建模技术的变化,限制了他们预测未来跌倒事件发生确定结果的能力[22]。此类装置的能耗较高,电池供电时间较短[23],对其平民化普及造成一定限制,在满足老年用户使用需求、改善用户体验方面存在差距。此外,可穿戴设备放置既需考虑测量结果的准确性和代表性,也需考虑佩戴对象的舒适性。目前,针对最佳放置位置仍存在争议,有研究认为胸部和腰部因靠近人体中心,更能准确检测跌倒;但也有研究认为将可穿戴设备的传感器固定于躯干测量结果更为准确。同时考虑测量准确性和舒适度仍然面临挑战。如使用口袋来保存智能手机会降低检测程序的有效性,只要设备可以在口袋内自由移动,并降低内置加速度计表征用户移动性的能力。但若将手机固定在病人胸部或腰部,则会影响病人的舒适度,同时妨碍了使用智能手机常规功能的自由。最后,可穿戴设备应在针对特定医疗群体经过有效的精度测试或可靠性检验后谨慎使用于临床治疗和决策中。未来,仍需进行大量前瞻性研究设计,解决上述不足,从临床价值、易使用、易佩戴等方面建立基于可穿戴设备的跌倒风险预测模型及将其应用于相关的智能终端和平台[28],以最大化发挥该设备在跌倒风险预测中的实际使用价值。

2.3 机器学习 机器学习通过识别病人数据中与研究者感兴趣的临床结果相关的多变量,开发稳健的预测模型[28]。机器学习算法可以在单个模型中整合大量不同数据类型(连续、分类或顺序)的变量,从而最大限度地提高性能并最小化与多重比较相关的问题。与统计假设检验不同,机器学习侧重于预测精度,并提供在未知和未来数据集上估计模型概括性的方法,两者在临床实践中都至关重要。目前,在跌倒预测中应用较多的机器学习算法是决策树算法、支持向量机算法、朴素贝叶斯算法、随机森林算法、人工神经网络算法和深度学习等[12,29]。决策树是机器学习中常见的一种方法,处理数据效率较高,在跌倒风险预测模型的构建中应用较多,可细分为分类决策树、回归决策树、极端梯度提升等类型[30]。Marschollek 等[31]通过对大量老年住院病人评估数据进行数据挖掘,建立了分类树跌倒预测模型,其总体分类准确率为66.0%,灵敏度为55.4%,特异度为67.1%,阳性预测值和阴性预测值分别为15.0%和93.5%。该模型有效识别出高龄(70 岁以上)、低Barthel 指数(≤45 分)、认知障碍、多重用药和共病5 个高风险人群亚组。该模型仍需从前瞻性研究设计和经济学角度开展进一步的验证,此外,也有必要建立一个混合风险分类模型,以扩大其应用人群及范围。Ye 等[32]基于极端梯度提升算法从电子病历中提取165 225 例老年病人的信息并建立了1 年跌倒预测模型,该模型AUC 值为0.807,其中50%被识别高风险真阳性的病人在第2 年的前94 d 内发生了跌倒。该模型还提前捕捉到了第2 年前30 d 和30~60 d 发生的58.01%和54.93%的跌倒。极端梯度提升算法在最终预测模型中捕获了157 个有影响的预测因子,其中认知障碍、步态和平衡异常、帕金森病、跌倒史和骨质疏松症被确定为未来跌倒事件的前5 个最强预测因子。Deschamps 等[33]使用决策树模型帮助医务人员客观地评估第1 次跌倒发生的风险,该模型共提取13 个预测因子,认为营养不良、膝关节活动范围受限、踝关节感觉减退以及听力和视力缺陷的老年人发生首次跌倒的风险较高。虽然该模型是可用于预测老年人首次跌倒发生的简单易用的工具,但仍需通过更大的队列研究来验证其准确性及临床相关性。Tamura 等[34]通过使用BBS 进行决策树分析,发现最近1 年内有1 次以上跌倒史、肌肉无力、使用助行器或轮椅、需要协助转移、使用麻醉品、危险行为及高度自立是跌倒的危险因素。此外,提出无跌倒史、不需要协助转运或BBS 评分≥51 分的病人跌倒风险较低。该研究表明,基于决策树的跌倒预测有效且直观。但此项研究未纳入正在使用麻醉镇静药物的病人,因此其在不同人群预测有效性还有待验证。支持向量机算法主要用于解决模式识别领域中的数据分类问题,属于监督学习算法的一种[30]。Polus 等[35]将机器学习与可穿戴设备相结合用于预测病人全髋关节置换术后跌倒的风险。提出使用仅来自术前预约的传感器衍生度量的支持向量机分类器获得了高性能模型(准确度为0.87,灵敏度为0.97,特异度为0.46,AUC 为0.82)。当将术后2 周的数据添加到术前数据中时,使用线性判别分析分类器获得了整体改善的性能(准确性为0.90,灵敏度为0.93,特异度为0.59,AUC 为0.88)。人工神经网络是一种具有非线性适应性信息处理能力的算法,可克服传统人工智能方法对于直觉信息处理方面的缺陷[30]。已有研究探索了人工神经网络在老年人跌倒风险预测中的作用[36]。Kabeshova 等[37]招募3 289 名65 岁及以上的社区志愿者检验3 种人工神经网络多层感知器、修正的多层感知器和增强拓扑的神经进化(neuro evolution of augmenting topologies,NEAT)对复发性跌倒者和非复发性跌倒者进行分类的效率。结果表明,与MLP 和修正的MLP 相比,使用15 种临床特征的NEAT 表现出最佳的跌倒复发预测效率,其灵敏度为80.42%,特异度为92.54%,阳性预测值为84.38%,阴性预测值为90.34%,准确性达88.39%,是识别老年社区居民复发性跌倒的有效神经网络。深度学习模型是机器学习领域中一个新的研究方向,接近于人工智能(artificial intelligence,AI)[30]。研究表明,深度学习模型中的多任务学习,可以基于可穿戴传感器数据有效评估跌倒风险[38]。Mauldin 等[39]基于3 个不同的跌倒数据集(智能手表、Notch 及Farseeing)使用传统(支持向量机和朴素贝叶斯)和非传统(深度学习)机器学习算法创建跌倒预测模型。结果表明,深度学习能够从原始加速度计数据中自动学习朴素贝叶斯和支持向量机无法获得的细微特征,用于跌倒检测的深度学习模型在3 个数据集上的性能通常优于更传统的模型。综上所述,目前越来越多的国内外学者意识到了机器学习在老年人跌倒风险预测中相较传统风险评估方法的巨大优势。将机器学习应用于可穿戴跌倒风险预测系统中,可以更好地提高跌倒检测性能[40],这也是未来可穿戴设备和机器学习在老年人跌倒风险预测中的发展趋势和研究重点。但机器学习的算法较多,各种算法均有其优缺点,如何基于临床实际需求和特定研究人群特征,选取最优的算法,调整算法学习架构和参数以提高预测模型的有效性仍有待进一步研究。

3 小结

老年人跌倒是一个受到全球重视的公共健康问题,因跌倒对老年人及其家庭的危害较多较大,跌倒风险预测模型对于及时、及早识别和区分高、低跌倒风险老年人,制定精准化干预措施,有效预防其跌倒具有重要价值和意义。

猜你喜欢
灵敏度量表预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
基于机电回路相关比灵敏度的机电振荡模式抑制方法
选修2—2期中考试预测卷(A卷)
以患者为主的炎症性肠病患者PRO量表特异模块条目筛选
网络服装虚拟体验的概念模型及其量表开发
《公共体育服务政府供给社会期待量表》的编制与修订
Beta-blocker therapy in elderly patients with renal dysfunction and heart failure
CSE阅读量表在高中生自我评价中的有效性及影响因素