参附强心丸治疗慢性心力衰竭的证据概述

2021-02-06 12:20姚红旗任晓宇
中西医结合心脑血管病杂志 2021年2期
关键词:低质量置信区间样本量

姚红旗,张 璇,赵 婷,任晓宇

心力衰竭是各种心脏疾病的终末阶段,已成为21世纪最常见的严重慢性疾病[1],目前我国心力衰竭病人多达450万人[2]。中国心力衰竭病人注册登记研究(China-HF)显示心力衰竭住院病人病死率为5.3%[3],病人5年生存率与恶性肿瘤相当。在我国临床心力衰竭治疗实践中,中医药因其在改善临床症状、提高生存质量、增加活动耐量等方面均具有自身的优势,被广泛地加载应用,中西医结合的治疗理念进一步确立[4]。参附强心丸是由天津市著名中医心血管病专家马连珍教授的经验方研制而成[5],属于国家中药保护品种,该方据《妇人良方》中的“参附汤”和《金匮要略》中的“己椒苈黄丸”化裁而来,参附汤由人参、炮附子、生姜、大枣组成,具有益气温阳散寒的功效,由防己、椒目、葶苈子、大黄组方而成的己椒苈黄丸则善治水饮停积脘腹的症状,两方合用,共奏益气助阳、强心利水之效。本研究依据现有临床研究,系统评价参附强心丸治疗慢性心力衰竭的疗效和安全性,以期为进一步临床应用及研究提供参考。

1 资料与方法

1.1 检索策略 计算机检索中国期刊全文数据库(CNKI)、中文科技期刊全文数据库(VIP)、万方数据库(WanFang)、中国生物医学文献数据库(CBM)、EMbase、PubMed、the Cochrane Library,检索时间均从各数据库建库至 2019年3月。中文检索词包括:参附强心丸、心力衰竭、心功能不全、心功能障碍,英文检索词包括:Shenfu Qiangxin pills,heart failure,cardiac failure,heart decompensation。

1.2 文献纳入与排除标准

1.2.1 纳入标准 ①研究类型:临床随机对照试验(RCT);②研究对象:符合慢性心力衰竭诊断标准[1]及纽约心脏病协会(NYHA)心功能分级Ⅰ~Ⅳ级的心力衰竭病人,原发病包括冠心病、高血压性心脏病、肺源性心脏病、扩张型心脏病等;③干预方式:对照组采用西医规范治疗(包括利尿剂、血管转换酶抑制剂或血管紧张素Ⅱ受体拮抗剂、β受体阻滞剂、洋地黄制剂、醛固酮受体拮抗剂、硝酸酯类等)或添加安慰剂,试验组在对照组的基础上加用参附强心丸;④评价指标:左室射血分数(LVEF)、左室舒张末期内径(LVEDD)、N末端B型脑钠肽前体(NT-proBNP)、B型利钠肽(BNP)、6 min步行距离(6MWD)、明尼苏达心力衰竭生活质量量表(MLHF-Q)积分、中医证候疗效及不良反应。

1.2.2 排除标准 ①非临床研究、个案报道、综述等;②数据有误、数据不完整或无法获得数据的文献;③重复发表的文献(包括翻译过的文献),仅取其中数据最全的1篇,其余皆剔除;④组间基线资料有差异或无可比性的文献;⑤纳入的受试者包括以下任何一种情况:因先天性心脏病、肥厚型心肌病、限制型心肌病、缩窄性心包炎、系统性浸润性疾病、甲状腺功能亢进性心脏病、酒精性心肌病及围生期心肌病等所导致的心力衰竭;合并恶性心律失常、恶性肿瘤、严重肝肾功能不全、严重感染等疾病;孕妇及哺乳期妇女;精神障碍及智力发育不全。

1.3 信息筛选及提取 阅读全文后,根据纳入与排除标准确定最终纳入文献,并提取相关资料,信息提取条目详见表1。

表1 信息提取条目

1.4 统计学处理 采用Cochrane系统评价软件RevMan 5.3进行分析。计数资料用相对危险度(RR),计量资料采用加权均方差(WMD),单位不统一的指标则采用标准化均方差(SMD),均以95%置信区间(CI)表示。采用Q检验及I2检验分析统计学异质性,显著性水平设定为α=0.1,如P>0.1或I2≤50%,提示各研究间异质性较小,采用固定效应模型;如P≤0.1或I2>50%,则异质性明显,采用随机效应模型,用敏感性分析检验结果的可靠性,并作漏斗图以观察发表偏倚。

1.5 证据评价方法 采用GRADE工作组2004年推出的证据分级体系[6]进行评价,证据分级为4个等级:高质量、中等质量、低质量、极低质量,RCT开始被定为支持干预效果估计的高质量证据,但5种因素可导致证据质量下降,包括研究的局限性、不精确性、不一致性、间接性、发表偏倚。①局限性:根据相关结局指标本身的性质,给予偏倚风险评估,盲法的使用对主观性指标相当重要[7]。在偏倚风险比例图中,以红色或黄色为主,给予降1级;以绿色为主,给予降0.5级或不降级。②不一致性:即合并效应量的异质性,若I2<40%,表明异质性低,则不降级;若40%60%,表明具有很大的异质性,则降1级[8]。若仅纳入1篇RCT,不需要评价一致性,此条目不参与降级。③间接性:研究对象、干预措施、测量结果等如有不一致酌情降1级或0.5级;若纳入较少的RCT,则根据其研究设计与实际应用之间的差异性判断是否降级[9]。④不精确性:根据总样本量是否达到最优信息样本量(OIS)及其合并效应量置信区间的宽窄度,给予降级处理。若总样本量<300例,可降1级;总样本量≥300例,合并后效应量的置信区间较宽,给予降0.5级;总样本量≥300例,且置信区间较窄,则不降级[10]。⑤发表偏倚:一般不予降级;当纳入的研究数较多时,可作漏斗图,如漏斗图有明显的不对称,降0.5级[11]。最终这5种降级因素判断完成后,若不降级,证据评级为“高质量”;若降0.5~1.5级,证据评级为“中等质量”;降2.0~2.5级及以下,证据评级为“低质量”;若降3级及以上,证据评级为“极低质量”。

2 结 果

2.1 文献检索结果 初检文献共获得168篇可能相关文献,含中文文献167篇、外文文献1篇,通过软件NoteExpress 3.2进行查重处理,剔除重复文献36篇,获得132篇可能相关文献,阅读文献题目及摘要,剔除动物实验10篇、药理实验4篇、文献综述4篇和其他不相关文献97篇。初筛纳入文献17篇,下载全文阅读后排除文献12篇,最终纳入文献5篇,均为中文文献。

2.2 纳入文献的基本特征 5项RCT[12-16]共涉及病人421例,其中试验组212例,对照组209例;男 243例(57.72%),女178例(42.28%);NYHA心功能分级Ⅱ~Ⅳ级,有记录者421例,其中,Ⅱ级175例(41.57%),Ⅲ级197例(46.79%),Ⅳ级49例(11.64%);原发病:高血压性心脏病84例,冠心病18例,扩张型心肌病17例,风湿性心脏病12例,肺源性心脏病9例;1篇[16]存在病例脱落现象无法统计,2篇[13-14]未提及原发病。纳入5项RCT对照组均采用西药常规治疗或加用盐酸贝那普利片治疗,试验组均在对照组基础上加用参附强心丸,用药剂量每次6 g,每日2~3次,疗程8周至3个月,2篇[12,15]文献疗程为8周,2篇[13-14]文献疗程为12周,1篇[16]文献疗程为3个月。详见表2。

2.3 Meta分析结果及证据评级

2.3.1 LVEF 5项[12-16]研究报道了 LVEF,各研究间有明显的异质性(P<0.1,I2=65%),采用随机效应模型。Meta分析结果显示,试验组LVEF优于对照组[WMD=4.39,95%CI(2.80,5.98),P<0.000 01] 。详见图1。3篇文献[12,14,16]描述采用随机数字表产生随机序列,余2篇[13,15]则未报告随机序列产生的具体措施;5篇文献均未报告分配隐藏的具体措施,未发现选择性报告及其他偏倚。详见图2。总样本量421例,满足最优样本量,效应量的置信区间较宽,异质性较大(I2=65%),未发现各研究间观察对象、干预措施及测量结果的差异。因此,降2级处理,GRADE证据评价为低质量。

2.3.2 LVEDD 5项[12-16]研究报道了LVEDD,研究间有明显异质性(P<0.1,I2=85%),采用随机效应模型。Meta分析结果显示,试验组LVEDD优于对照组[WMD=-2.79,95%CI(-3.67,-1.92),P<0.000 01] 。详见图3。3篇文献[12,14,16]描述采用随机数字表产生随机序列,余2篇[13,15]则未报告随机序列产生的具体措施;5篇文献均未报告分配隐藏的具体措施,未发现选择性报告及其他偏倚。详见图4。总样本量421例,满足最优样本量,效应量的置信区间较宽,异质性较大(I2=85%),未发现各研究间观察对象、干预措施及测量结果的差异。因此,降2级处理,GRADE证据评价为低质量。

2.3.3 NT-proBNP 4项[12-14,16]研究报道了 NT-proBNP,研究间无明显异质性(P>0.1,I2=17%),采用固定效应模型。Meta分析结果显示,试验组降低NT-proBNP的疗效优于对照组[SMD=-0.71,95%CI(-0.92,-0.50),P<0.000 01]。详见图5。3篇文献[12,14,16]描述采用随机数字表产生随机序列,余1篇[13]则未报告随机序列产生的具体措施;4篇文献均未报告分配隐藏的具体措施,未发现选择性报告及其他偏倚。详见图6。总样本量357例,满足最优样本量,效应量的可信区间较窄,无明显异质性(I2=17%),未发现各研究间观察对象、干预措施及测量结果的差异。因此,降0.5级处理,GRADE证据评价为中等质量。

表2 纳入研究的基本情况

图1 两组LVEF比较的森林图

图2 两组LVEF比较的偏倚风险图

图3 两组LVEDD比较的森林图

图4 两组LVEDD比较的偏倚风险图

图5 两组NT-proBNP水平比较的森林图

2.3.4 BNP 仅1项[15]研究报道了BNP,因此不做异质性检验。Meta分析结果显示,试验组降低BNP的疗效优于对照组(P<0.05)。该研究未报告随机序列生成及分配隐藏的具体措施,未发现选择性报告及其他偏倚。详见图7。总样本64例,未满足最优样本量,效应量的置信区间较宽,实验设计与实际应用无明显差异。因此,降2级处理,GRADE证据评价为低质量。

图7 两组BNP比较的偏倚风险图

2.3.5 6MWD 2项[13,16]研究报道了6MWD,研究间有明显异质性(P<0.1,I2=70%),采用随机效应模型。Meta分析结果显示,试验组提高6MWD的疗效优于对照组[WMD=40.62,95%CI(6.98,74.25),P=0.02]。详见图8。这2项研究均描述采用随机数字表产生随机序列,但未报告分配隐藏的具体措施,未发现选择性报告及其他偏倚。详见图9。总样本量197例,未满足最优样本量,效应量的置信区间较宽,异质性较大(I2=70%),未发现各研究间观察对象、干预措施及测量结果的差异,未发现发表偏倚。因此,降2.5级处理,GRADE证据评价为低质量。

2.3.6 MLHF-Q积分 2项[14,16]研究报道了MLHF-Q积分,研究间无明显异质性(P>0.1,I2=0%),采用固定效应模型。Meta分析结果显示,试验组改善生活质量的疗效优于对照组[WMD=-6.83,95%CI(-8.76,-4.90),P<0.000 01]。详见图10。这2项研究描述采用随机数字表产生随机序列,未报告分配隐藏的具体措施,且未使用盲法,存在高偏倚风险。详见图11。总样本191例,未满足最优样本量,效应量的置信区间较宽,无明显异质性(I2=0%),未发现各研究间观察对象、干预措施及测量结果的差异,未发现发表偏倚。因此,降2级处理,GRADE证据评价为低质量。

图8 两组6MWD比较的森林图

图9 两组6MWD比较的偏倚风险图

图10 两组MLHF-Q积分比较的森林图

图11 两组MLHF-Q积分比较的偏倚风险图

2.3.7 中医证候疗效 2项[15-16]研究报道了中医证候疗效,研究间无明显异质性(P>0.1,I2=6%),采用固定效应模型。Meta分析结果显示,试验组中医证候疗效改善优于对照组[RR=1.40,95%CI(1.18,1.66),P=0.000 1]。详见图12。1项[16]研究描述采用随机数字表产生随机序列,另1项[15]未报告随机序列生成的具体措施,此2项研究均未报告分配隐藏的具体措施,且未使用盲法,存在高偏倚风险。详见图13。总样本量171例,未满足最优样本量,效应量的置信区间较窄,无明显异质性(I2=6%),未发现各研究间观察对象、干预措施及测量结果的差异,未发现发表偏倚。因此,降2级处理,GRADE证据评价为低质量。

图12 两组中医证候疗效比较的森林图

图13 两组中医证候疗效比较的偏倚风险图

2.4 安全性 5项研究中,2项[15-16]研究报道称对比治疗前后的血、尿、便常规及肝肾功能均未见异常,同时未发现皮疹、恶心、胃脘部不适等不良反应;余3篇[12-14]文献未提及不良反应。

3 讨 论

本研究中Meta分析结果表明,参附强心丸具有提高LVEF、减小LVEDD、降低BNP 和 NT-proBNP 水平、增强运动耐力、改善生活质量的作用,且安全性良好。对于降低死亡率、再住院率等远期疗效的影响还需进一步证实。本研究中仅3项RCT描述了用随机数字表方法产生随机序列,全部RCT均未描述分配隐藏的具体措施,且忽视盲法的使用,对结论的真实性造成重大影响;单个RCT的样本量偏少,不满足最优信息样本量,研究设计的缺陷成为主要的GRADE降级因素,导致得出低质量证据,参附强心丸的疗效指标临床证据质量大多数为低质量,少见中等质量,未见高质量。

参附强心丸具有益气温阳、活血利水、通补兼施的功效,其主治心肾阳虚合并血瘀水停型心力衰竭[5]。本研究中纳入的文献中,大部分研究者依据心力衰竭的西医诊断标准严格筛选研究对象,而缺乏心肾阳虚合并血瘀水停证的中医辨证依据,所纳入的心力衰竭病人是否均属此证候有待商榷,继而对参附强心丸的功效存在一定的影响。把握证候规律,规范应用中医药,客观全面评价,是中医药立足现代心力衰竭治疗体系的重要工作,应当积极创造条件,协作开展基于辨证论治的大样本、多中心、随机双盲的中医药临床评价研究,彰显中医特色疗效[17],提高中医药临床应用的循证医学证据质量。

猜你喜欢
低质量置信区间样本量
基于贝塔分布的最优置信区间研究
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
样本量与东方蜜蜂微卫星DNA遗传多样性参数稳定性的关系
网络Meta分析研究进展系列(二十):网络Meta分析的样本量计算及精确性评估
医学研究中样本量的选择
定数截尾场合Pareto分布形状参数的最优置信区间
低质量实用新型专利申请授权对经济秩序的影响
基于预警自适应技术的监控系统设计
效应量置信区间的原理及其实现
低质量的婚姻不如高质量的单身,是真的吗?(一)