随机对照临床试验设计中的样本量估算方法

2023-02-12 10:51王瑞平

上海医药 2023年1期

王瑞平

（上海市皮肤病医院临床研究与创新转化中心上海 200443）

样本量估算是随机对照临床试验（randomized controlled trial, RCT）研究设计的重要内容。样本量过小不能保证得出可靠的研究结论。而样本量过大则会造成不必要的人力、物力和财力的浪费，同时也会增加研究的难度。因此，如何根据不同的RCT类型，估算出合理的样本量是临床研究工作者应掌握的一项重要技能。本文从影响样本量大小的因素着手，以举例形式重点阐述RCT研究设计的样本量估算方法。

1 影响样本量估算的重要参数

在样本量估算时，应明确几个参数：①Ⅰ类错误概率α，一般取0.01或0.05，α越小样本量越大。②把握度β，一般取0.1或0.2，β越小样本量越大。③允许误差δ，δ越小样本量越大。④干预的有效率（p1和p0）或疗效评价结果均值差值（D）和标准差（SD），p1和p0的差异越大，样本量越小；SD与D的比值越大，样本量越大。研究者可以根据自己的实际情况，通过调整参数的选择确定合适的样本量[1]。

此外，RCT的样本量估算与研究的设计类型有关。常用的临床研究设计包括差异性研究设计、优效性设计、非劣性设计和等效性设计。在样本量估算时还须明确依据的参数，无论是以上哪种临床研究设计，样本量均应依据该临床试验的主要疗效指标来估算样本量。RCT中常用的主要疗效指标包括两大类，第一类为“定量变量”指标，如手术中出血量、中医证候评分、疼痛视觉模拟评分（visual analogue scale, VAS）等；第二类为“定性变量”指标，如治疗有效率，痊愈率、银屑病皮损面积和严重程度指数（psoriasis area and severity index, PASI）75达成率等。研究者须根据具体情况选择合适的指标进行样本量估算。此外，须指出的是，主要疗效指标的来源有2个，第一个是研究者自己课题的预试验，这个是普遍比较推荐的，样本量估算的准确度高；第二个是来自文献，须注意，试验组和对照组的参考数据指标应来源于同一篇参考文献，而不能是来源于2篇文献或多篇文献。

2 差异性研究设计样本量估算

2.1 以定性变量为主要疗效结局指标的临床试验研究

1）当研究为两组均等平行1∶1设计时的样本量估算例如，拟开展电针治疗失眠的平行对照临床试验研究。预实验结果显示，电针治疗组的有效率为90%，假电针治疗组的有效率为50%，假设该研究的Ⅰ类错误概率α＝0.05，把握度（1－β）＝90%，试估算该研究所需要的样本量。根据该临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

根据上述计算，每组需要23例，考虑10%脱落率，每组应招募26例，两组共计52例。

2）当研究为3组及以上均等平行设计时的样本量估算例如，预开展针灸配合心理疗法治疗失眠的临床试验，采用差异性均等（1∶m）设计方案，分为针灸治疗组、针灸联合心理疗法组、心理疗法组等3组。预实验中，针灸联合心理疗法的有效率为94%，单纯针灸疗法的有效率为85%，单独心理疗法组有效率为80%，设α＝0.05（双侧），把握度（1－β）＝90%，β＝0.10，由此估计样本量n。根据该临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算，因为该研究设置了3个平行组，预实验p1＝94%、p2＝85%、p3＝80%，而样本量计算公式中仅有p1和p2这2个数据可以带入，这时应选择2个差异最小的率带入公式，其计算出的样本量最大，结果也最为保守。由此，选择p1＝85和p2＝80%代入公式。此外，因为是3组设计，后续牵涉到两两比较，所以应调整检验水准α，由α＝0.05调整为a＝0.05/3＝0.017代入公式计算：

根据上述计算结果，每组需要1 557例，考虑10%脱落率，则每组应招募1 713例，三组共计5 139例。

2.2 以定量变量为主要疗效结局指标的临床试验研究

1）当研究为两组均等平行1∶1设计时的样本量估算例如，预研究一种新型镇痛泵对外科术后的止痛效果，以术后24 h VAS为主要疗效指标，采用平行对照设计，分为常规药物镇痛组和镇痛泵干预组。查阅类似设计的文献结果显示，常规药物镇痛组的VAS评分平均值μ1＝4分，镇痛泵干预组VAS评分平均值μ2＝1分，标准差s＝3分，考虑10%脱落率，假设本研究的Ⅰ类错误概率α＝0.05，把握度（1－β）＝80%，试估算本研究所需要的样本量。根据本临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

根据上述计算，每组需要16例，考虑10%脱落率，每组应招募18例，两组共计36例。

2）当研究为两组不均等设计（k＝1∶2）时的样本量估算例如，同样是研究新型镇痛泵对外科术后的止痛效果，以术后24 h VAS为主要疗效指标，但采用差异性不均等设计（k＝1∶2），分为常规药物镇痛组和镇痛泵干预组。查阅类似设计的文献结果显示，常规药物镇痛组的VAS评分平均值μ1＝4分，镇痛泵干预组VAS评分平均值μ2＝1分，标准差s＝3分，假设本研究的Ⅰ类错误概率α＝0.05，把握度（1－β）＝80%，考虑脱落率为10%，试估算本研究所需要的样本量n。根据本临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

根据上述计算，镇痛泵干预组需要24例，常规药物镇痛组需要12例，考虑10%脱落率，镇痛泵干预组需要28例，常规药物镇痛组需要14例，两组共计42例。

3）当研究为多组均等设计时的样本量估算例如，仍然预研究新型镇痛泵对外科术后的止痛效果，以术后24 h VAS为主要疗效指标，但采用差异性均等（1∶m）设计方案，分为镇痛泵干预组（n1）、常规药物镇痛组（n2）和安慰剂组（n3）。假定镇痛泵干预组VAS评分平均值μ1＝1分，常规药物镇痛组VAS评分平均值μ2＝4分，安慰剂组VAS评分平均值μ3＝7分，标准差s＝3分，设α＝0.05（双侧），β＝0.10，考虑10%脱落率，由此估计样本量n。根据本临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

λ为自由度为k－1的卡方分布非中心参数，k为组数，可查表1获得。

表1 λ界值表

根据上述计算，每组需要7例，考虑10%脱落率，每组需要8例，3组共计24例。

3 优效性设计样本量估算

优效性设计：检验一种药物或治疗方法是否优于另一种药物或治疗方法的试验，称为优效性试验。一般对于以安慰剂作为对照或加载试验的临床试验应设计为优效性临床试验。

Δ为一具有临床意义的数值。拒绝H0可得出试验药比对照药优效。

定性变量为主要疗效指标样本量公式：

定量变量为主要疗效指标样本量公式：

1）以定性变量为主要疗效结局指标的临床试验研究，两组均等平行1∶1设计。例如，假定某对照药的治愈率为60%，估计新药的治愈率可能达到80%，且根据理论新药不可能比对照药差。研究者认为新药疗效至少要优于对照药5%才有临床意义。采用均等（1∶1）优效性设计方案，设α＝0.025（单侧），β＝0.20（单侧），Δ＝5%，估计样本量n。根据本临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

根据上述计算，每组需要140例，考虑20%脱落率，每组需招募168例，两组共计336例。

2）以定量变量为主要疗效结局指标的临床试验研究，两组均等平行1∶1设计。例如，新型镇痛泵对外科术后的止痛效果，以术后24 h VAS为主要疗效指标，采用均等（1∶1）优效性设计方案，分为镇痛泵干预组和常规药物镇痛组。预实验显示，镇痛泵干预组VAS评分平均值μt＝1分，常规药物镇痛组VAS评分平均值μc＝4分，标准差s＝3分，假设本研究的Ⅰ类错误单侧概率α＝0.025，把握度（1－β）＝90%，研究者认为镇痛泵干预组相比于常规药物镇痛组VAS评分至少降低2分（Δ＝－2分）才有临床意义。在考虑20%脱落率的情况下，试估算本研究所需要的样本量。根据本临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

根据上述计算，每组需要189例，考虑20%脱落率，则每组需要227例，两组共计454例。

4 非劣效设计样本量估算

非劣效性设计：检验一种药物/治疗方法是否不劣于另一种药物/治疗方法的临床试验，称为非劣效性试验。非劣效性设计要求阳性对照药应具有稳定的优效性，一般用于由客观疗效指标的临床研究中（例如2型糖尿病降糖治疗中的糖化血红蛋白）。

Δ为一具有临床意义的数值。拒绝H0可得出试验药比对照药优效。

定性变量为主要疗效指标样本量公式：

定量变量为主要疗效指标样本量公式：

1）以定性变量为主要疗效结局指标的临床试验研究，两组均等平行1∶1设计。例如，估计某对照药的治愈率为85%，试验药的治愈率为80%，在一项RCT中，如果试验药比对照药最多差10%则可以被接受。采用均等（1∶1）非劣效性设计方案，设α＝0.025（单侧），β＝0.20（单侧），Δ＝10%，估计样本量n。根据本临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

根据上述计算，每组需要902例。考虑10%脱落率，则每组最终需要992例，两组共计1 984例。

2）以定量变量为主要疗效结局指标的临床试验研究，两组均等平行1∶1设计。例如，试验药某量表评分平均值μt＝15，阳性对照组药μc＝16，标准差s＝2.0。假设本研究的Ⅰ类错误单侧概率α＝0.025，把握度（1－β）＝90%，研究者认为两者疗效之差不超过1.8分（Δ＝1.8）即有临床意义。根据本临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

根据上述计算，每组需要99例。考虑10%脱落率，则每组需要109例，两组共计218例。

5 等效设计样本量估算

等效性设计：检验一种药物/治疗方法是否与另一种药物/治疗方法的疗效“相等”的试验，称为等效性试验，常用于评价仿制药的临床药效，Δ为等效性界值。

Δ为一具有临床意义的数值。拒绝H01和H02即可得出试验药等效于对照药。

定性变量为主要疗效指标样本量公式：

定量变量为主要疗效指标样本量公式：

以定性变量为主要疗效结局指标的临床试验研究，两组均等平行1∶1设计。例如，估计某对照药与试验药的治愈率均为70%，两药治愈率之差不超过10%即认为等效。采用均等（1∶1）等效性设计方案，设α＝0.05（双侧），β＝0.20（双侧），Δ＝10%，由此估计样本量n。根据本临床试验研究的设计，结合主要疗效结局指标，采用如下公式进行样本量估算：

根据上述计算，每组需要440例。考虑10%脱落率，每组则需要488例，两组共计976例。