宏基因组二代测序和GeneXpert MTB/RIF对结核病诊断价值的Meta分析

2022-12-01 13:14王雅娟曹新益刘升明
中国防痨杂志 2022年12期
关键词:敏感度比值结核病

王雅娟 曹新益 刘升明

结核病感染率高、死亡率高,但对其诊断不尽如人意[1]。在传统的结核分枝杆菌病原诊断手段中,涂片镜检的敏感度低且无法区分其他抗酸杆菌,而培养周期长,又不利于早期诊断。GeneXpert MTB/RIF(简称“Xpert”)是一种核酸扩增技术,因敏感度和特异度较高且周期短等优点,已在2010年被世界卫生组织推荐用于结核病快速诊断和利福平耐药性筛查[2],目前也在我国较广泛地应用。但2020年全球肺结核病原检出率较2019年仅提高了2%,且各地区间检出率差异较大[1],因此,临床仍需探索更快速有效的诊断方法。

随着宏基因组二代测序技术(metagenomic next-generation sequencing,mNGS)的发展,其在临床微生物检测中的应用越来越广泛,并显示出良好的综合应用价值[3]。然而,目前比较mNGS与Xpert对结核病诊断价值的研究多以小样本为主,且所得结果存在一定差异。因此,笔者对使用mNGS和Xpert诊断结核病准确性的文献进行荟萃分析,比较两种方法在结核病诊断中的应用价值并进行综合评价,为优化临床快速诊断能力及加强治疗和管理提供参考。

资料和方法

一、文献来源及检索策略

系统检索PubMed、Embase、Cochrane Library、Web of Science、中国知网(CNKI)、中国生物医学文献数据库(CBM)、万方和维普数据库自建库至2022年7月5日公开发表的关于mNGS与Xpert诊断结核病准确性的文献。检索策略为“主题词+自由词”,中文检索词为:结核、结核分枝杆菌感染、分枝杆菌感染、宏基因组二代测序、高通量测序、二代测序、利福平耐药实时荧光定量核酸扩增检测技术等;英文检索词为:Tuberculosis、Mycobacteriumtuberculosisinfection、TB、Kochs disease、Metagenomic next-generation sequencing、Next-generation sequencing、mNGS、NGS、Xpert MTB/RIF、GeneXpert MTB/RIF、Xpert、GeneXpert等。以Embase数据库为例的检索策略见表1。

表1 以Embase数据库为例的检索策略

纳入标准:(1)研究目的:比较mNGS和Xpert诊断结核病的准确性;(2)研究对象:根据临床表现、影像学检查等疑诊为结核病患者;(3)检测手段:同时予mNGS和Xpert检测;(4)参考标准:培养或临床综合诊断结果;(5)结局指标:有足够建立诊断效能分析的四格表数据,即真阳性(true positive,TP)值、假阳性(false positive,FP)值、假阴性(false negative,FN)值、真阴性(true negative,TN)值。

排除标准:(1)文献类型为病例报告、综述、 会议论文、评论、摘要、信件、专家意见和动物实验;(2)重复文献;(3)无法获取全文文献。

二、研究方法

1.文献筛选及数据提取:由2名研究者根据纳排标准独立筛选和纳入文献,以预先制定的资料表提取数据,若结果有分歧则通过小组协商解决。提取的资料包括第一作者、发表年份、研究设计、地区、样本来源、样本量、样本年龄和性别组成、标本类型、检测方法、参考标准、TP值、FP值、FN值和TN值等。

2.偏倚风险和适用性评价:使用诊断准确性试验质量评价工具(quality assessment of diagnostic accuracy studies-2,QUADAS-2)[4]对所有最终纳入文献分别从偏倚风险和适用性两方面进行评价,评价内容包括病例选择、待评价试验、参考标准、流程与进展4个部分。满足评价标准为“是”,不满足评价标准为“否”,部分满足或描述不详细为“不清楚”。每个部分中所有问题均回答为“是”时即为“低风险(low risk)”,其中任一问题回答为“否”即为“高风险(high risk)”,其他情况为“不清楚风险(unclear risk)”。评价过程由2名研究者独立完成,必要时小组协商决定。

三、统计学处理

采用R 4.2.0和R Studio 2022.07.0+548软件、meta 5.5-0和mada 0.5.11软件包及其依赖包进行资料的统计分析。

1.诊断准确性试验评价指标:根据四格表数据分别计算每个纳入研究待评价试验的敏感度、特异度、诊断比值比及其95%可信区间(95%CI);采用mada软件包双变量模型拟合综合受试者工作特征曲线(SROC曲线),并计算其曲线下面积(AUC)。

2.异质性分析:(1)阈值效应检验:计算敏感度与(1-特异度)对数的Spearman相关系数r,若相关系数r>0.6、P<0.05或SROC曲线呈典型“肩臂状”分布,即提示存在阈值效应,此时通过 AUC值评价诊断效能,否则进一步合并效应量;(2)非阈值效应检验:通过I2统计量和Cochrane-Q检验进行评估,若I2>50%(代表中度以上的异质性)、P<0.05,则采用随机效应模型合并效应量以部分消除异质性对结果的影响,否则采用固定效应模型。根据不同的标本进行亚组分析。

3.发表偏倚分析:采用Deeks漏斗图检验发表偏倚,检验水准α=0.05。

4.敏感性分析:分别以敏感度、特异度和诊断比值比作为敏感性分析指标,采用逐一剔除文献法,以评价本研究所得结果的稳定性。

结 果

一、文献检索结果及纳入研究的基本特征

共检索到666篇文献,根据纳排标准,最终纳入12篇文献[5-16],包括中文文献5篇(即文献5~7、11和 15)、英文文献7篇(即文献8~10、12~14和16);其中,文献5、14和15无mNGS和Xpert并联诊断的完整四格表资料。共纳入1344例患者,其中,检测肺组织标本(不包括胸腔积液和淋巴结)685例、肺外组织标本659例;最终871例诊断为结核病,包括肺结核412例和肺外结核459例。文献筛选流程见图1,纳入研究文献基本信息及数据资料见表2、3。

表2 纳入研究文献的基本信息

图1 文献筛选流程图

二、偏倚风险和适用性分析结果

QUADAS-2量表评价结果显示,12篇文献均未提及详细的盲法设计方案。“病例选择”部分,文献11采用病例-对照设计被判断为“高风险”;“参考标准”部分,文献8、10和14的参考标准包含mNGS或Xpert检测阳性,文献13包含Xpert检测阳性,故均被判断为“高风险”,其余各部分文献评价均无“高风险”,具体见表4。

表3 纳入研究文献的原始数据资料 (例)

表4 纳入研究的QUADAS-2量表风险评价结果

三、Meta分析结果

1.诊断准确性试验评价指标:根据表3数据分别计算各纳入研究中mNGS、Xpert和mNGS+Xpert检测方法的敏感度、特异度、诊断比值比及其95%CI,具体见表5。再绘制3种检测方法的SROC曲线,获得AUC值分别为0.931、0.860和0.978(图2)。

表5 纳入研究的诊断准确性试验评价指标

续表5

图2 三种检测方法诊断结核病的综合受试者工作特征曲线

2.异质性检验:(1)阈值效应检验:mNGS、Xpert和mNGS+Xpert 检测方法的Spearman相关系数r分别为:-0.119(P=0.712)、0.403(P=0.194)和-0.527(P=0.145),均不存在明显阈值效应。(2)非阈值效应检验:mNGS检测的敏感度、特异度、诊断比值比的I2统计量和Cochrane-Q检验结果分别为I2=92.3%和P<0.01、I2=0.0%和P=0.896、I2=0.0%和P=0.716;Xpert的结果分别为I2=90.0%和P<0.01、I2=0.0%和P=0.732、I2=36.5%和P=0.098;mNGS+Xpert的结果分别为I2=92.3%和P<0.01、I2=0.0%和P=0.951、I2=0.0%和P=0.436。各研究间mNGS、Xpert及mNGS+Xpert并联诊断的敏感度异质性均有统计学意义,采用随机效应模型合并效应量;特异度和诊断比值比的异质性均无统计学意义,采用固定效应模型进行合并。

3.合并分析结果:mNGS诊断结核病的合并敏感度、合并特异度、合并诊断比值比及其95%CI分别为:63.4%(54.4%~73.8%)、99.8%(98.9%~100.0%)和58.6(29.6~115.8),Xpert分别为50.3%(41.2%~61.3%)、99.9%(99.1%~100.0%)和23.8(12.3~46.0),mNGS+Xpert分别为68.7%(60.1%~78.6%)、99.8%(98.9%~100.0%)和91.2(40.2~207.3)(图3~5)。进一步根据标本类型,将纳入研究分为肺泡灌洗液组、脑脊液组、其他肺外(不包含脑脊液)或多部位标本组,分析mNGS、Xpert及两者并联诊断在各组中的合并敏感度及特异度(表6)。

表6 mNGS、Xpert及两者并联诊断在不同类型标本中的合并诊断效能

图3 mNGS诊断结核病的敏感度、特异度和诊断比值比森林图

图4 Xpert诊断结核病的敏感度、特异度和诊断比值比森林图

图5 mNGS+Xpert诊断结核病的敏感度、特异度和诊断比值比森林图

4.发表偏倚:采用Deeks漏斗图进行发表偏倚检验(图6),结果显示:mNGS、Xpert和mNGS+Xpert三种检测方法均存在发表偏倚(P=0.013、0.010、0.033)。

图6 mNGS、Xpert和mNGS+Xpert三种检测方法的发表偏倚Deeks漏斗图分析

5.敏感性分析:分别对合并敏感度、特异度、诊断比值比进行敏感性分析,逐一剔除各项研究,结果显示,所得合并统计量差异均无统计学意义,研究所得结果较为稳定。具体见图7~9。

图7 mNGS的敏感性分析结果

图8 Xpert的敏感性分析结果

图9 mNGS+Xpert的敏感性分析结果

讨 论

全球结核病防治是一场持久战,早期诊断在其中具有举足轻重的地位。当前的许多研究均表明了mNGS和Xpert相较于传统检测方法的优势,但受限于mNGS和Xpert较高的检测成本,临床上较少将其联合应用于临床一线诊断。因此,有必要比较两者诊断结核病的效能,以供临床选择和参考,但目前尚缺少比较两者对结核病诊断准确性试验的Meta 分析。

本文对纳入的12项研究进行了荟萃分析,以综合比较mNGS和Xpert诊断结核病的准确性。综合分析显示,mNGS和Xpert均具有良好的结核病诊断能力,其中,前者合并敏感度、合并诊断比值比及AUC值均较Xpert高;而且,将二者联合后的诊断效能更高,明显提高了合并敏感度和诊断比值比,AUC值达到了0.978。此外,两种检测方法及其联合检测的合并特异度均>95%,差异不大,提示误诊率均较低。

既往研究表明,标本类型可影响mNGS和Xpert诊断结核病的敏感度和特异度[17-20],这可能是本次Meta分析纳入的研究在敏感度方面异质性较大的原因。本研究根据标本类型进一步将纳入的研究分为3组,Meta分析得出:Xpert检测肺泡灌洗液的敏感度最高(63.8%),与mNGS检测的敏感度相差不大(64.3%),而在脑脊液中的检出最低(41.8%);mNGS在脑脊液组和其他肺外或多部位标本组中的检测敏感度(64.6%和60.8%)均优于Xpert(41.8%和50.8%),但两者检测不同标本类型的特异度无明显差异,且均>95%。另外,本文纳入的文献参考标准不完全一致,其中有2篇参考标准为临床诊断,1篇为液体培养,其他均为病原学加临床复合诊断,这也可能造成研究结果的异质性。通过进一步行敏感性分析表明,剔除任一篇文献后所得的合并敏感度、特异度、诊断比值比均无明显变化,可认为所得结果较为可靠。

本研究尚存在以下不足:首先,纳入的12项研究中,研究地区均为中国,患者年龄均>18岁,缺少结核病低负担地区及儿童结核病相关的研究,不同发病率地区和儿童检测标本可能会影响mNGS和Xpert的诊断效能[17, 21-22]。其次,虽然本研究进一步对标本类型进行了分组分析,但并未发现造成异质性的具体来源。此外,Deeks检验提示不排除存在发表偏倚,可能会造成所得诊断效能的高估,今后需纳入更多新的研究进行分析。最后,虽然mNGS在诊断感染性疾病中有诸多优势,但要注意的是,在临床应用前,往往还需要区分定植菌、污染菌以及对报告进行准确解读[23]。

综上所述,mNGS和Xpert对结核病诊断均具有应用价值,且Xpert联合mNGS检测和mNGS单一检测的总体敏感度均高于Xpert,而特异度相差不大。鉴于检测成本等问题,笔者建议mNGS检测可应用于危重症、混合感染等复杂病例;而对Xpert检测阴性但临床仍怀疑结核分枝杆菌感染的病例,尤其是肺外结核,Xpert联合mNGS检测也有望提高病原检出率。

利益冲突所有作者均声明不存在利益冲突

作者贡献王雅娟:直接参与研究方案设计、实施研究和撰写文章;曹新益:参与采集数据、分析和解释数据;刘升明:直接参与研究方案设计、指导研究实施和审阅文章

猜你喜欢
敏感度比值结核病
警惕卷土重来的结核病
艾滋病合并结核病的诊断和治疗
贵州省结核病定点医院名单
假体周围感染联合诊断方法的初步探讨*
一种基于属性的两级敏感度计算模型
物理中的比值定义法
不同应变率比值计算方法在甲状腺恶性肿瘤诊断中的应用
算好结核病防治经济账
平均功率与瞬时功率的比较与应用
下尿路感染患者菌群分布及对磷霉素氨丁三醇散敏感度分析