NoSAS评分对睡眠呼吸暂停综合征诊断效能的Meta分析

2021-11-03 09:08曾丽娟何啟忠成俊芬广东医科大学附属第二医院广东湛江524000
广东医科大学学报 2021年5期
关键词:敏感性异质性特异性

曾丽娟,刘 旺,彭 敏,何啟忠,成俊芬 (广东医科大学附属第二医院,广东湛江 524000)

睡眠呼吸暂停综合征(sleep apnea syndrome,SDB)是以睡眠时候反复呼吸停止为特征的疾病,其发病率较高[1]。全世界至少有2%的成年妇女和4%的成年男子患此疾病[2]。然而,有大量的睡眠呼吸暂停综合征患者未被诊治[3-4],从而产生较多不良影响,例如睡眠不足导致行为改变、工作效率降低及交通事故增加,同时增加心血管疾病和代谢性疾病的发病率及死亡率,导致高额的临床和经济成本[5-8]。因此,SDB 患者的诊治水平尚需进一步提高。目前,诊断SDB 的金标准是多导睡眠图(polysomnography,PSG)。睡眠呼吸暂停综合征的诊断及严重程度通常由呼吸暂停低通气指数(apnea hypoventilation index,AHI)确定,AHI≥5/h,可诊断为SDB;AHI≥15/h,存在中重度SDB;AHI≥30/h,存在重度SDB[9]。但此测试需耗时较长和费用较大,不可用作常规筛查,不能广泛应用。因此,不同的临床评分如NoSAS、Berlin、STOP-Bang、STOP评分,被提出作为筛选工具。

NoSAS评分是一个简单和容易使用的工具,评估参数为颈围、肥胖、打鼾、年龄、性别。近年来,越来越多的研究结果表明NoSAS 评分比Berlin、STOPBang、STOP 等评分更具有优势[10-12]。因此,本文纳入关于NoSAS 评分诊断SDB 的相关原始文献,以Meta分析对其诊断价值进行评价。

1 材料和方法

1.1 文献检索及资料提取

1.1.1 检索策略 检索数据库为维普中文期刊数据库(VIP)、中国期刊全文数据库(CNKI)、万方数据库(WFSD)、PubMed 数据库、Embase、Cochrane 和Web of science 等。检索词结合自由词、布尔逻辑运算符连接词及MeSH 主题词拟定,为“睡眠呼吸暂停低通气综合征”“阻塞性睡眠呼吸暂停”“睡眠呼吸暂停”“睡眠呼吸暂停综合征”“NoSAS 评分”。在检索中对文献进行参考文献的追溯,检索语言限定为中文及英文,检索时间限定为建库至2020年12月15日。

1.1.2 纳入及排除标准(1)纳入标准:①中、英文文献;②原始文献的研究对象为SDB 患者(AHI≥5/h、NoSAS 评分≥8);③原始文献的评价指标包含NoSAS评分;④金标准为PSG;⑤能直接或通过计算获得四格表中的数据。(2)排除标准:①文摘、综述、述评或个案报道类文献;②数据重复发表;③无法获得四格表数据;④不包含待评价检测指标;⑤非中文或英文文献。

1.1.3 文献选取 由2 位研究者独立检查标题和摘要、正文以选择符合条件的研究,剔除不符合条件的文献。然后,由相同的2 位研究者对剩余文章进行全文水平的审查。关于研究选择的分歧通过与第3 个作者进行讨论加以解决。

1.1.4 数据提取 2 位研究者独立地从符合条件的原始研究中提取数据,包括作者、发表日期、病例数目、区域、研究类型等。主要提取的数据为NoSAS 评分诊断SDB 的敏感度、特异度、真阳性(TP)、真阴性(TN)、假阳性(FP)和假阴性(FN)。关于数据提取的分歧通过与第三个作者进行讨论加以解决。

1.2 文献质量评价

按照Cochrane 协作网推荐的QUADAS-2作为诊断性试验的质量评价工具,QUADAS-2 由4 个领域组成:病例选择、待评价试验、金标准和病例流程及进展情况。由2 名研究者对每一个纳入的原始研究进行评估,将偏倚和适用性的风险被评定为低、高或不清楚。关于质量评估的分歧通过与第三位作者的讨论加以解决。如果任何一个或多个与偏倚风险有关的QUADAS-2 标准被判断为高或不明确,则认为该研究存在偏倚风险。

1.3 统计学处理

根据纳入研究的原始数据提取或计算TP、TN、FP和FN。统计学软件为RevMan及Stata。

1.3.1 诊断准确性的合并分析 用Stata 软件计算合并敏感度、特异度、曲线下面积。绘制森林图和SROC 曲线被用以说明单个的以及合并的数据。用SROC曲线下面积(AUC)来总结诊断效果。

1.3.2 异质性检验 阈值效应存在于诊断性实验中,并且可能是异质性的来源之一。通过Meta-Disc 软件计软件计算Spearman 相关系数评价阈值效应。采用χ2检验判定研究间异质性,P<0.05 或I2≥50%表示存在显著的异质性,并进行Meta 回归探索研究间异质性的来源。

1.3.3 Meta 回归分析 为探索异质性的来源,根据以下因素进行了回归分析:(1)研究类型为前瞻性或回顾性;(2)地域为亚洲或非亚洲;(3)样本量为:样本量≥500或样本量<500。

1.3.4 敏感性分析 评估个别的研究对整体合并值的影响。

1.3.5 发表偏倚 采用Deek’s 漏斗图来确定是否存在发表偏倚。

2 结果

2.1 检索结果

初步检索得到96 篇相关文献,其中中文文献8篇,英文文献88 篇,将重复的文献剔除后剩余57 篇。经过浏览题目及摘要初步筛选,排除病例报告、综述、信件、摘要、评论、指南和不属于研究领域的文献,共28 篇文献符合纳入和排除标准。阅读全文后,共筛选出符合条件的文献15 篇[13-27],其中2 篇文章里面含有两组实验,将其均拆分为2 项研究,则共有17 项研究。Duarte 等[13,15,17]的文献共有3 篇,每篇文献的研究对象均不一样,分别为怀疑睡眠呼吸紊乱的成人、病态肥胖患者以及失眠患者,不存在重复;文献选取的流程如图1 所示。纳入的17 项研究,共纳入的病例16 028 个。所有符合条件文献的TP、FP、FN 和TN 如表1所示。

2.2 文献质量

应用QUADAS-2评价表进行评价的结果见图2、3。关于病例选择部分,17 篇文献未说明选择研究对象时,仅有1 篇说明了是连续的,有1 篇未给出时间界限。关于金标准的部分,“金标准的解释是否在对待评价诊断试验结果不知情的情况下做出的?”,有1 篇说明了研究者是在未知的待评价实验的结果下做出的,其余文献未明确说明;“待评价试验的结果判读是否是在不知晓金标准试验结果的情况下进行的?”,所有的文献中均未明确说明。最后,关于病例流程的部分,有5 篇文献说明了待评价实验和金标准之间无时间间隔,有2 篇文章待评价实验和金标准之间有时间间隔,其余均未说明。

2.3 异质性检验

合并敏感性异质性分析得到I²=94.5%,P<0.01;合并特异性异质性分析的到I²=90.9%,P<0.01。纳入的原始文献存在较大的异质性,选择随机效应模型来合并统计量。异质性来源将通过Meta 回归分析来探索。

图3 QUADAS-2 文献质量评价

2.4 Meta 分析合并效应量

最终合并敏感性为0.761(95%CI 0.711~0.805),合并特异性为0.612(95% CI 0.542~0.677),SROC 曲线下 面积为0.75(95% CI 0.71~0.79)。森林 图及SROC 曲线见图4~6。

图4 NOSAS评分诊断SDB的SROC曲线

2.5 Meta 回归分析

将研究者所处地域(亚洲及非亚洲)、研究类型(前瞻性及回顾性)、样本量大小(小于500 及大于等于500)作为协变量纳入回归分析,研究类型及样本量两个因素差异无统计学意义,P=0.5007 及P=0.3598(P>0.05),非异质性来源;而地域差异有可能是异质性来源的影响因素(P=0.0045,差异有统计学意义)。异质性来源可能为地域差异。

2.6 亚组分析

按研究类型不同进行亚组分析:(1)当只纳入前瞻性研究的文献时,I²=97.21%,P<0.01,合并敏感性为0.79(95% CI 0.735~0.837),合并特异性为0.605(95%CI 0.513~0.690),综合ROC 曲线下面积为0.77(95%CI 0.73~0.81);(2)当只纳入回顾性研究的文献时,I²=98.68%,P<0.01,合并敏感性为0.742(95% CI 0.664~0.806),合并特异性为0.621(95% CI 0.521~0.711),综 合ROC 曲 线 下 面 积 为0.74(95% CI 0.70~0.78)。

图5 合并敏感性的森林图

图6 合并特异性的森林图

2.7 敏感性分析

逐一排除纳入的文献,观察重新合并的敏感性、特异性均未发生很大改变,说明本文meta 分析合并结果稳定及可信。例如:将箱线图(图7)中离中心最远的卿思敏等的文献剔除之后,合并敏感性为0.774(95% CI0.730~0.812),合并特异性为0.597(95%CI0.529~0.662),综合ROC 曲线下面积为0.76(95%CI0.72~0.79),合并效应量结果改变不大。

图7 箱线图

2.8 发表偏倚

绘制Deek’s 漏斗图(图8)检测发表偏倚,P=0.07,说明不存在发表偏倚。

图8 Deek’漏斗图

3 讨论

SDB 对人类的生活及健康造成极大的影响。因此,许多学者在SDB 的诊断及治疗上进行了大量的研究。根据我们先前的研究发现女性患者年龄较大;而男性发病率高于女性,颈围高于女性[28-32]。此外,以前对SDB 病理生理学的描述强调了颈部和腹部脂肪分布在睡眠中导致上气道阻塞的重要性[33]。NoSAS采用最新的睡眠呼吸事件判断指南,减少了主观因素(如打鼾、乏力、目击呼吸暂停等)的参与,使其临床价值较STOP-BANG等更优[34]。

本研究严格按照纳入和排除标准共选择了15 篇有关NoSAS 评分诊断睡眠呼吸暂停综合的研究,其中2篇文献包含了两组研究,因此共有17个研究。以PSG 作为金标准,评估NoSAS对SDB 的诊断价值,本文得出NoSAS 诊断SDB 的最终合并敏感性为0.761(95% CI 0.711~0.805),合并特异性为0.612(95% CI 0.542~0.677),SROC曲线下面积为0.75(95% CI 0.71~0.79)。说明此联合检测技术可诊断76.1%的SDB 患者及排除61.2%的非SDB 患者。对于SDB 这样的疾病,可能更重要的是,筛查测试具有较高的敏感性,且不会错过SDB 患者,而不是高度特异性,特别是对于具有较高疾病预测试概率的人群。本文进一步通过灵敏度分析和回归分析探讨了导致异质性产生的可能因素。灵敏度分析未发现偏离性离群研究,提示研究间的同质性较好。回归分析提示地域差异可能为引起研究间产生异质性的重要因素。

但本文也存在不足,在于:(1)纳入的文献仅为中文及英文文献,而未纳入其他语言的研究,可能存在语种偏倚;(2)纳入关于NoSAS诊断SDB的文献较少仍需规范的、大样本的、多中心的临床研究进一步明确。

综上所述,NoSAS 评分对SDB 有良好的诊断效能。在无法进行PSG 的情况下,我们可以利用NoSAS评分对可疑SDB患者进行评估。尽管NoSAS评分对SDB 有良好的诊断效能,但由于目前所纳入文献较少,仍需进行更多的相关研究对其进行验证。

猜你喜欢
敏感性异质性特异性
基于可持续发展的异质性债务治理与制度完善
管家基因突变导致面部特异性出生缺陷的原因
钇对Mg-Zn-Y-Zr合金热裂敏感性影响
精确制导 特异性溶栓
现代社区异质性的变迁与启示
AH70DB钢焊接热影响区组织及其冷裂敏感性
基于偏好异质性的市场契约设计及其治理
区域异质性:农村人力资本与农民收入增长
重复周围磁刺激治疗慢性非特异性下腰痛的临床效果
如何培养和提高新闻敏感性