针刺临床随机对照试验改进方法的探究

2024-02-01 04:05樊伟铭孙驰雲张晶潾丁姝辰仲俊泓赵欣楠孟楚川张曦元许安萍程凯李志刚
上海针灸杂志 2024年1期
关键词:盲法受试者针刺

樊伟铭,孙驰雲,张晶潾,丁姝辰,仲俊泓,赵欣楠,孟楚川,张曦元,许安萍,程凯,李志刚

(北京中医药大学,北京 100029)

在过去的几十年中,中医针刺疗法因其良好的疗效在西方受到了广泛关注,由此催生了大量相关的随机对照试验(randomized controlled trial,RCT),设计方法亦层出不穷。然而,当测试针刺的疗效时,却产生了很多相互矛盾的结果。大部分研究[1-2]一致表明,与无治疗的对照组相比,真实针刺和安慰针针刺治疗都具有显著的效果,尽管一些研究[3-8]表明真实针刺比安慰针刺更加有效,但也有其他研究[9-12]未能证明真实针刺有比安慰针刺更好的效果,因此在国内外产生了诸多争议。虽然产生这些矛盾结果的原因涉及多方面[13],但这表明对针刺临床研究中RCT 设计做出进一步分析及改进有其必要性。

1 国内外针刺试验设计的分析

据不完全统计,1921—2020年全球累计有19 775 篇针灸相关的SCI 论文发表[14]。国外第1 篇针刺相关的SCI 论文早在1921年4月即在《英国医学杂志》上发表[15];而国内第1 篇针刺学SCI 论文则被认为在1988年发表于《中国药理学报》[16]。相较而言,国内虽然有着丰厚的针灸文化底蕴,但临床试验方面起步较晚。而近年来国内针刺相关论文发文量不断上升,且部分试验在质量上也有显著提升,彰显了国内针刺临床试验水平的进步。

而一直以来,国内外一些发表在国际知名期刊且受到学界认可的针刺临床试验,却得出了几乎相反的结论,甚至是同1 项试验,分别在国内外进行,都会产生结论的差异。例如1 篇发表在《美国医学会杂志》子刊的文章揭示了中外治疗方式、环境的不同可能会影响试验的结果[17]。在这项针刺对头颈癌患者辐射性口干的影响的研究中,仅位于中国的研究中心的针刺组与假针组的疗效存在差异,而设在国外的研究中心却并没有得到这样的结论。笔者将通过国内外典型的针刺临床试验设计,进一步分析结果产生差异的原因。

1.1 国外针刺试验分析

21世纪初,为证实针刺的临床疗效,德国召集多位临床医生、专家和统计学家共同参与了其设计的德国针刺试验(German acupuncture trials,GERAC)项目,诸多著名的医学期刊均发表了其研究报告,影响巨大。其中,GERAC 关于针刺治疗膝骨关节炎的试验证实了针刺治疗的有效性且优于常规的疼痛治疗,但也得出了不依照传统理论的针刺也优于常规治疗,即假针刺的疗效与之比较差异无统计学意义的结论,给传统针灸理论带来巨大的冲击[18]。与此同时,最近的1 项研究也表明,在接受“试管”婴儿技术治疗的女性中,针刺组与假针组在活产率上差异无统计学意义[10]。另1 项针刺治疗帕金森疲劳的试验中,针刺组与假针组疗效比较差异无统计学意义,因此得出了针刺主要通过非特异性或安慰剂作用治疗帕金森疲劳的结论[19]。

这些试验之所以得出了这样的结论,可能因为其设计仍存在缺陷。其一,其中作为对照组的“微量”针刺或多或少仍存在治疗作用,并不能作为严谨的安慰剂对照,这影响了研究者对针刺治疗的功效判断;其二,参与试验的国外医生的背景特殊且针刺训练程度有限,可能并没有对针刺治疗组施展充分的针刺治疗;其三,对于对照组中接受的微量针刺所产生的临床和生理效应也没有给出具体说明。这些缺陷使对照试验的意义大打折扣,因此获得的证据并不完全可信[20]。

1.2 国内针刺试验分析

近年来,国内针刺临床试验水平有显著增高,诸如刘保延教授、梁繁荣教授、刘存志教授和刘志顺教授等所带领的团队,都先后在国际顶级期刊,如《内科年鉴》《美国医学会杂志》《英国医学杂志》等发表了针刺相关的RCT[21-22]。其中,刘存志教授团队进行的针刺治疗膝骨关节炎的研究采用多中心RCT,证据质量高,偏移风险较小[8]。研究证实了针刺在治疗膝骨关节炎方面的优势,且设计颇具独到之处。首先,其盲法实施严格,采用多中心随机分层,除针灸师外,受试者、结果评估者和统计学家均进行设盲,盲法评价的结果也显示成功,其选择的针灸师经验丰富且在试验开始前接受了统一的培训;其次,其电针组和手针组均要求得气,穴位选择均基于临床实践和专家共识,采用半标准化穴位,针灸师可依据受试者的具体情况选择辅助穴位,较好地体现了中医的辨证论治思想;除此之外,该试验针刺疗程得当,随访周期长,结局指标较为完善,尤其是将主要结局指标下放到个体层面,体现干预在个体水平的效果,更加贴近临床实际。

除此之外,刘志顺教授团队在其针刺治疗慢性前列腺炎/慢性盆腔疼痛综合征的试验中,也采取了多中心随机对照的方法,基于前期研究和专家共识设计干预方案,遴选具有5年针灸本科教育和至少2年临床经验的针灸师来操作,大大提升了试验结果的可靠性[23]。同时,针刺组通过提插捻转等手法刺激得气,假针组则选择在穴位旁开点进行刺激。结果表示,与假针刺比较,针刺改善了疼痛、排尿功能障碍、焦虑和抑郁的相关症状以及生活质量。

2 影响针刺试验结果的可能因素

2.1 受试者因素

国内外受试者对于针刺治疗的接受程度、既往针刺经历状况不尽相同。国内患者对针刺治疗大多有一定了解,对其信任程度较高,得到的安慰剂效应将会更强,而国外患者相对了解较少,会产生试验结果的差异,影响其准确性。例如在近期的1 个试验中,864 例患者参与了包括偏头痛、紧张性头痛、慢性腰痛和膝骨关节炎4项不同的研究,他们被随机分配到8周的针刺治疗或假针刺治疗组中[24],在对干预、年龄、性别、主诉持续时间等混杂因素进行调整后,与基线相比,在针刺和假针刺组中,具有高受益预期的患者比那些具有低预期的患者更有可能减轻超过50%的疼痛。

2.2 操作者因素

国内外针灸医生资质标准不同,国内针灸师往往注重辨证的准确性、配穴选择的合理性和操作手法的严格性,而国外针灸医生更侧重于操作规范标准,效果作用快等方面的培训。1 项基于针对疼痛情况的针刺试验的个体患者数据Meta分析包括了39项试验,几乎所有参与者都生活在西方国家[25]。在这些试验中,有14 项并没有要求针灸师有临床经验,20 项需要6 个月到4年的经验,5 项至少有5年的临床经验,可见国外针刺临床试验对操作者的临床资质要求并不统一。

2.3 对照针刺设计因素

针刺过程中虽然有穴位选择的记录,但还有许多针灸师认为也很重要的因素却没有被记录,如刺激量、针具长度、刺入深度、取穴个数、行针手法等,甚至在治疗过程中的医患互动、个性化的干预、环境情况也不可或缺,这些与针刺过程相关的因素亦影响针刺临床效果。因此,目前的针刺对照设计几乎不能达到理想状态,这也对试验的准确性产生影响。

3 针刺临床试验的特殊性分析

虽然在目前的针刺临床研究中,RCT 仍是比较特定治疗与安慰剂对照效果的金标准,但普通的RCT 可能并不适用于常规的针刺临床试验。

3.1 个体特殊性

中医学所谓“一人一方”,即由于每个人身体的基本状况不同,针灸师并不会选择同一组配穴进行治疗(例如同为头痛,中医学有外感邪气、肝阳上亢、血虚、肾虚等多种病机),从中医学角度需要针灸师经望闻问切之四诊合参对患者进行辨证,再随证治之。而大多针刺试验只关注对患者某一临床症状进行相同配穴的治疗,并没有进行整体论治,这可能大大削减了针刺治疗的临床效果。此外,具有不同临床经验水平的针灸师对同一个患者的选穴治疗可能也不尽相同,而这一点也开始被试验团队意识到并做出相应改善。

例如,已有学者[26]在研究针刺治疗餐后不适综合征的试验中,基于名老中医经验和预试验来优化针刺治疗处方,采用半标准化的试验设计,对每个患者进行辨证论治,充分考虑不同的病因病机。其要求针具、针刺次数、诊疗过程和针刺操作流程标准化,而针刺穴位处方则在标准化的前提上保留个性化的特色,制定了1 组基本穴位和3 组根据疾病特点来选取的个体化穴位。这既确保了试验结果的科学性和严谨性,也保留了传统中医辨证论治的基本理念,在应对针刺临床试验的特殊性上进行了初步探索。

当然除此之外,试验人员可以针对这种特殊性建立专家委员会来确定针刺操作细节的最佳流程,如穴位选择、刺激技术等,以提升试验证据的质量[27]。

3.2 针刺治疗特殊性

针刺疗法以对患者损伤小、不良反应小、见效快等特点受到国内外研究者的关注。而治疗效果不仅仅是针刺本身,还包含许多其他复合因素。而在某些情况下,这些复合因素可能发挥了不可替代的治疗作用。最近1 项研究得出结论,针刺的安慰剂作用是可塑的;而另1 项研究则表明,假针刺的效果可以分解成数个部分,并能以类似于药物剂量依赖性的方式叠加[28]。

为了解释这一现象,李永明教授提出了“气球理论”(图1),将针灸临床治疗可能产生的疗效和不良反应分为5 个层次[29]。第1 层,自愈效果;第2 层,安慰剂效应;第3 层,心身疗法;第4 层,泛穴疗效;第5 层,穴位疗效。“气球理论”表明,首先,每个层次的体积的总和,即复合疗效,是通过针刺临床应用能达到的最终疗效;其次,“气球”内部各层次的体积呈动态变化,一层的改变会对其他层次产生影响;最后,“气球”由5 个层次组成,缺一不可。受试者接受到的是完整“气球”的疗效,而临床上很难将每一层次的疗效作出区分。

图1 “气球理论”模型[29]

通过分析大部分以往的针刺试验设计发现,研究者往往不以针刺的复合效应为前提,把特穴疗效以外的效果混为一谈,将它们的总和疗效与其做不公平的对照。根据“气球”模型,如果某一层的功效在一些疾病中发挥了较大的作用,则其他层的功效将受到隐藏,这可能严重削减针刺特定穴位的疗效,因此很难用小样本量来测定最外层效果和其他4 层总和的差异。

4 针刺临床RCT 方法的探索

由上述分析可知,现有的诸多方法各有利弊,探索1 种适合针刺治疗的临床试验方法,加以普及应用,可能才是为针刺治疗效果“正名”的有效途径。而近年来此类探索研究层出不穷,提供了许多新思路。

4.1 RCT 方法的改进

4.1.1 实用性RCT

实用性RCT 属于效果研究,主要用于衡量干预的实际效果,体现干预在实际临床条件下可以达到的疗效,可以在不改变现有治疗方案基础上评估特定干预措施的效果,用于比较研究临床疗效。其干预措施是综合干预,能够反映个体化治疗的特点。有专家提出,为了评价针刺临床试验的整体治疗效果,比较临床中不同的治疗方案,衡量干预措施的整体效果,以优化针刺的临床治疗方案,总结临床治疗规则,使整体疗效最大化,研究者应首选实用性RCT[30]。

实用性RCT 可以比较实际临床条件下不同的治疗方案,注重该条件下干预的有效性,并建议采用协同作用最大化设计,强调对结果测量者、数据收集者和统计分析师也进行设盲。其对照组的设置也非常细致全面,标准对照,试验组使用针刺治疗,对照组使用西医方法治疗;不同针刺方法,试验组使用新型的针刺方法,对照组使用正常针刺临床治疗方法;不同治疗方法,试验组使用针刺治疗,对照组使用其他的临床治疗方法;空白/等待对照,将等待治疗的受试者作为对照组,与治疗组同等待时间,同时评价两组疗效,等待期结束后再给予与治疗组相同的治疗。实用性RCT 衡量代表受试者健康水平的整个过程,注重多方面结果的收集,包括患者的报告结果、治疗结束后的生活质量和卫生经济学评价等,其计划对受试者进行长期随访,观察试验干预的长期疗效,强调对临床终点结果的记录。

4.1.2 技能型RCT

技能型RCT 是指在对受试者随机分组时,以干预者专业知识和操作水平为分组基础来设计试验,受试者将随机分配给不同水平的干预实施者,充分考虑到干预实施者本身对治疗效果的影响[31]。

技能型RCT 可以保证受试者接受的是擅长此种干预方法的医师的治疗,给予医师经验和技能充分的尊重,更容易招募受试者和相关医师,其设计避免了常规RCT 中可能出现医师实施1 种并不擅长疗法的现象,客观上增加了其放弃该疗法的可能,而技能型RCT 从根源上避免了因被分配到医师不擅长的干预方法所致的换组。但这种方法也有诸如过程重复难度大,可推广性不高、没有统一可靠的标准来衡量医师操作水平等问题,导致其未受到大范围试验的采纳。

4.2 安慰针刺装置设计的改进

安慰针刺对照是国际认可的评价针刺特异性效应的常用对照方法,但其合理性仍存在争议[32]。在很多试验中,安慰针刺组脱落率高于真针刺组,因此所谓安慰针刺参与的RCT 试验的科学性和准确性受到质疑[33]。

Streitberger 针[34]、Park 针[35]和 Takakura针[36](图2)是目前针刺临床RCT 中报告最常用的安慰针具[37],其中Streitberger 针应用最多,对其的盲法评价也大多为成功[38],但也有少部分文献报告盲法不完全成功[39]。Park 针也是常用的安慰针之一,与Streitberger 针一样,都通过了近年来大量针刺临床RCT 的检验,被认为能够实现盲法[40],但两者均不能实现对针灸师的设盲,因此大多数的针刺RCT 研究均为单盲,这严重降低了证据的质量。与Streitberger 针和Park 针不同,Takakura 针可以实现对针灸师的盲法,使针刺RCT 的双盲成为可能,但目前使用Takakura 针的针刺RCT 较少,尚未得到学界的普遍认可。

图2 3 种常用的安慰针刺装置示意图[37]

另外,在针刺RCT 中也存在1 种Foam 装置,即泡沫针(图3)[41]。与其他假针相比,Foam 装置简单且价格低廉。泡沫垫在视觉上隐藏了针头的进入点,因此受试者无法辨别正在使用哪种针。但该装置也存在问题,其所用的泡沫装置过厚且并非透明,导致针灸师无法保证其每次刺入的位置相同,从而刺入非穴位位置,影响试验的准确性,且Foam 同样不能实现对针灸师的设盲。

图3 Foam 针刺模拟装置示意图[41]

目前,国内研究者也正在积极探索设计新型安慰针刺装置。赵丹等设计了1 种假针装置(图4)[42]。为模拟针刺感觉,这种假针采用了新型针垫。假针的针垫由外、中、内三层构成,分别模拟针刺透皮、针刺肌肉层、针刺骨骼的针感,以求对针灸师设盲。其缺点在于无法像Streitberger 针或Park 针那样对受试者造成针头触碰皮肤的痛觉,故对受试者保持盲法可能较为困难。王毓婷等[43]发明的新型针刺辅助装置,其优点在于使用硅胶针垫模拟受试者皮肤及皮肤下组织,可以起到对针灸师的设盲作用,同时还能调整进针角度,以便针灸师进行斜刺等刺法(图5)。本装置已在1 项针刺治疗帕金森病患者焦虑的试验中应用,且经过盲法评价,志愿者无法区分他们接受的针刺类型,是1 种较为理想的安慰针刺装置[44]。

图4 “新型”假针针刺装置示意图[42]

图5 “新型”针刺辅助装置示意图[43]

总体来看,国内的安慰针具开发仍与国外存在一定差距,虽然国内新型的安慰针具在理论理想条件下能做到盲法,但毕竟没有经过大量RCT 的检验,也缺乏相关的盲法评价内容,在学界的认可度不高。而国外的安慰针具经过多年的发展与RCT 的检验,相较于国内则更加成熟,目前,日本团队研发的Takakura 针已经进行过盲法评价,并被证实可以完成针灸师与受试者的双盲,是近期研发出较被认可的安慰针刺装置[45]。

纵观以上装置,未来安慰针具设计应当将理论与实际相结合,不仅要求理论可行,更重要的是与针刺RCT 相结合,与患者躯体和心理相结合,以尊重继承中医学理论为前提,守正创新[46]。装置要经得起盲法评价的检验,在保持对针灸师和受试者设盲的基础上,还应具有一定的经济效应,尽可能降低制造成本,以便大范围地推广,以此开发更加科学可行的针刺模拟装置。

4.3 探索针刺试验的真实世界研究

真实世界研究是在医疗环境中,通过优化分析多种途径来源的数据而进行的研究。与RCT 相比,真实世界研究基于真实世界,数据来源于真实的临床实践,外部可推性强,经过数据质量的评估、样本量估算、数据清理后进行统计分析,最后解读结果,可为临床研究提供疗效方面的证据[47]。传统RCT 主要研究理想世界人群,有严格的纳入排除标准,研究时间较短,样本量较小,多为前瞻性研究,并不完全符合目前临床实际。而针刺治疗一向主张辨证论治、三因制宜,RCT 提供的标准化干预措施可能会掩盖针刺的真实疗效,因此在针刺试验并不完全适合应用RCT 来进行研究。现阶段,国内绝大多数与针刺相关的临床研究的设计都是基于传统RCT,真实世界研究数量不足,质量有很大的提升空间。因此,需要加强开展针刺试验的真实世界研究。

5 结语

本文总结归纳了部分现有的试验设计和方法,认为关于针刺临床RCT 的设计,仍需关注以下四方面。其一,充分认识针刺治疗的特殊性,细化治疗方案,设置多组对照,完善安慰针刺装置的设计,全面排除针刺带来的非特异性效应;其二,充分考虑患者个体的特殊性,依中医辨证分型制作针对性治疗方案,并对患者治疗意愿和恢复预期进行完整的调查记录;其三,充分了解针灸师即施术者本人的特殊性,选取经验丰富,擅长试验相关疾病治疗,且技术水平稳定的治疗者进行操作,并在治疗前对其进行统一的培训,以减少治疗的异质性,控制治疗的质量;其四,充分关注在真实世界中的针刺RCT 研究,为针刺临床应用决策提供更多参考。

猜你喜欢
盲法受试者针刺
涉及人的生物医学研究应遵循的伦理原则
涉及人的生物医学研究应遵循的伦理原则
盲法在临床研究过程中的主要作用
盲法的实现在论文中如何阐述
谈针刺“针刺之要,气至而有效”
涉及人的生物医学研究应遵循的伦理原则
注射用血塞通治疗脑梗死恢复期瘀血阻滞证的随机对照研究
涉及人的生物医学研究应遵循的伦理原则
患者盲法在疼痛相关随机对照试验中重要性的meta分析
针刺联合拔罐治疗痤疮50例