人体生物等效性试验数统分析方法介绍与应用

2021-11-27 06:06屈瑞陈芳宇刘廷薇陶秀梅
中国科技纵横 2021年22期
关键词:分析方法临床试验检验

屈瑞 陈芳宇 刘廷薇 陶秀梅

(1.武汉科技大学,湖北武汉 430070;2.北京诺康达医药科技股份有限公司,北京 100176)

0.引言

数统分析是一项药物临床试验过程中非常重要的一个环节,真实、可靠、可溯源的数据是药物最后获批上市的关键。试验过程中产生的数据必须是真实的、可靠的,从而才能从根本中解决现在临床数据库中的问题。

如今,各国家的卫健委及研究人员对药物质的安全性及有用性的认识不断提高。世界卫生组织、欧盟、日本、美国及我国都相继颁出有关临床试验数据管理与统计分析的指导原则,对药品试验数统分析也做出了明确的规定。美国制定出关于临床研究实验中采用网络行业指导规范,另外,美国为规范电子化数据过程制定了临床医学试验数据的规章制度。我国正在实施的药品临床试验管理的法律法规及其他各类药物临床试验的指导原则,尤其临床试验过程中的数据管理进行了详尽的描述。本文将详细介绍几种不同的数统分析方法及应用,针对临床研究中如何进行设计、实施、分析和评价提供参考,以保证药物临床试验的科学、真实和规范。

1.常见的数统分析方法

适当的临床试验数据管理与统计分析是确保招募到的受试者利益得到保障、提高临床试验质量的前提。以下为人体生物等效性试验中常用的数统分析方法,本文将从原理出发,对其进行详细的介绍。

1.1 描述统计方法

描述性统计为通过制作表格、图形以及使用总结性的说明来描述数据的离散和集中趋势、峰度、偏度。其中缺失值填充常用的方法有:均值法、剔除法、决策树法、比率回归法;正态性检验常用的方法有:非参数检验的K-量检验、P-P图、Q-Q图、W检验等。临床试验中通常使用的描述统计方法有:平均值、标准差、离散值、中位数、最小值和最大值以及正常值范围等。

1.2 推断统计方法

统计推断学是现代统计方法学中的最基础的方法,在统计研究中得到了广泛的使用,能研究根据样本量的数据去推断整体的数量值,对研究总体的数量特征做出一个统计的说明。统计推断就是在概率时间的基础上依据样本数据内容,对统计分析其他描述性参数做出一个合理的预判。

1.2.1 差异性检验

在临床试验过程中,常常使用Fisher检验对安全性指标,即不良事件发生率进行的评价。单组设计的定性资料常用于样本和总体之间差异性检验。成组设计的定性资料中若对应的变量是二分类型,通常用到的方法是制成一个四格表。

单组设计的定量资料和以上定性资料相比无较大差异,只是样本估计时用的参数为均值和中位数,运用正态性检验得到的结果选择一个适合的统计方法。对于成组设计的定量资料,如果两组定量资料之间是配对关系,第一步需计算差值,之后可采用单组设计的统计学方法。在结果描述时用差异值(均值、中位数等)以及95%的可信区间等内容。

1.2.2 相关分析和回归分析

相关分析和回归分析是融合为一体的,但两者研究的重点不同。相关分析作为回归分析的基石,回归分析作为相关分析的深入研究。

使用相关分析是为了衡量两个变量间的线性关系。在临床研究中常会用到的回归分析方法有:多重的线性回归、Poisson回归(计数型变量,Poisson分布)、Logistic回归(二项分布等)、负二项回归(负二项分布等)、COX模型回归等[1]。

1.2.3 生存资料的分析

临床试验研究的试验结果需要做长期或定期的随访才能得到最终的准确数据,评估影响因素和干预因素时,需要对试验过程中的事件进行true的分析,还要考虑到完成试验所要经历时间的长短。生存资料分析是将最终发生的事件判断是否为true,并且要结合完成的时间的统计分析方法[2]。

1.3 辅助统计方法

1.3.1 样本量预估和检验效能

临床研究不采用总体目标人群而是采用有代表性的样本来进行研究分析。根据假设检验的原理,样本如果较小,就无法检验出实际存在的差异,最终得到的结果缺乏可信的证据;样本如果太大,会造成人和物力以及时间的不必要浪费,更严重的会适得其反。除此之外,样本量的大小影响因素很多,如试验设计类型、检验水准、把握度、期望的效应值和标准差等[3]。

1.3.2 匹配

在非随机性的对照试验中,如果未提前对研究的对象进行随机,某些不为人知的因素会在组间分布不均匀,这就是的组件没有了可比性,从而无法可靠的评价分组因素的内在的作用。随着数统分析的发展,匹配越来越在样本量较大的检验中得到应用。常用的匹配方法有:个体匹配、多元匹配等[4]。

1.3.3 敏感性分析

敏感性分析适用于评价分析方法和结论的稳固性。临床研究的设计和分析方法一般以一个的假设为前提,如果不满足其假设分析方法是不适合的。通过改变统计分析方法和假设等方法来检验研究结果的一致性的敏感性问题。常见的情况有研究方案违背、缺失值、离群值、研究结束转归情况的不同定义、基线不均衡等[5]。

2.临床研究统计学的应用

2.1 描述统计方法的应用

描述性统计分析中最为常用的方法之一就是SPSS的频数分析。通过试验过程中各参数值的频数的分析,可得平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数和峰度系数等重要的描述统计量,还可以通过分析得到合理的统计图。王宇虹等[6]在“糖尿病合并子宫肌瘤临床治疗及效果评估”中记录了70例糖尿病并患有子宫肌瘤的患者,对照组为血糖控制和子宫肌瘤切除的方法,试验组为血糖控制和子宫肌瘤切除手术联合中药的治疗方法,通过统计两组患者的血糖控制达标率、手术切口愈合率、治疗效果满意率等。田炜超等[7]在“布洛芬缓释胶囊在中国健康受试者中生物等效性研究”中采用随机、开放、单中心、两制剂、两周期、两序列、自身交叉的单剂量生物等效性试验设计。在其安全性评价中对空腹及餐后试验过程中的不良事件及其发生率,以及对象的年龄、身高、体重等指标进行均值、标准差、中位数、最小值和最大值或范围的描述。

2.2 推断性统计方法的应用

统计推断包括参数计算与假设检验,国际医学统计学界和医学期刊编辑界在关于统计推断结果表达的规范中要求有报告检验统计量值和确切值范围,并且能给出相应的均数或率的可信区间。报告统计推断结果时,应同时给出相应均数、率的可信区间。罗云萍等[8]在“急性白血病患者的白细胞介素和肿瘤坏死因子水平改变及意义”中对急性白血病息者与正常人活性水平进行了比较,两组样本的活性指标分布属非正态的;不满足参数法检验的条件,故选取非参数秩和检验,或中位数法描述和检验。在评价第二代三唑类药物伏立康唑和两性霉素B脂质体抗真菌的疗效和安全性中,研究人员采用多中心、随机临床试验,其中四百多例分配到了伏立康唑组,400多例分配到两性霉素 B 脂质体组。各个成功率分别为26.0%和30.6%。推断疗效相等则伏立康唑和两性霉素B脂质体治疗成功率的差异不可超过10%,因此可评价两种治疗方法的成功率是具有等效性的[9]。在药物或医疗器械临床试验中,重复测量得到的数据是一种很常见的数据类型[10]。另外,随着当前药物和医疗器械市场在临床验证产品的日益增加,非劣效试验设计已成为广泛应用的一种设计方法,吴振强等[11]探讨了适用于非劣效试验设计下重复测量数据的统计分析方法,得到在基于非劣效试验设计的重复测量数据中,当数据存在缺失时,会降低组间的差异;而MMRM和GEE在不同的缺失值比例下都能有较好的性能。

2.3 辅助统计方法的应用

缺失值是临床试验过程中发生偏倚的原因,应尽可能地满足研究试验方案中与相关的检索资料和数据管理的各类规定。在实际试验中任何一项研究不可避免会有缺失值。然而一个试验中如果解决缺失值的方法是敏感的,尤其是其方法已在方案中体现,则可认为是有效的,统计师应当注意此结果得出分析具有敏感性,常见的处理方法有整例删除、单次补填、非条件均值估计、条件分布估计等。曹阳等[12]描述缺失性数据的特征和模式,对Rubin提出了的多重填补的基本概念,并且运用填补和分析缺失数据的方法,结合起来进行了探讨,分析了多重填补方法的特点、局限性以及应用此方法处理多个完整数据集时需要注意的地方。闫世艳等[13]介绍了一种较为简便的多重填补敏感性分析方法,当假定数据符合随机缺失机制进行填补后,进行结果的测定。Sposato等[14]研究了卒中前、卒中后房颤、以及缺血性卒中复发的三种情况时,使用了3个统计模型,对受试者的年龄、性别等变量进行了不同方面的验证。

3.讨论与结论

开展一项临床研究时,目标人群的总体不会被直接定义,通常应用统计学原理和方法进行总体样本的推断。在根据预试验的样本量得到的结果后,运用合适的统计公式推算出满足正式试验的样本量。试验过程中运用到的数据统计学无处不在:试验讨论与设计、数据管理计划的确定、数据审核计划的确定、数据管理报告的确定、统计分析计划制定、统计分析报告的制定和审核。临床试验结果需科学、真实的进行统计分析,才能得出临床研究中的准确、可靠的结论。为逐渐规范我国临床试验方案中的统计方法描述,近几年相继发布了《化学药物和生物制品临床试验的生物统计学技术指导原则》《药物临床试验的生物统计学指导原则》等指导原则,成为加强临床数据管理及统计的内容和责任。

猜你喜欢
分析方法临床试验检验
序贯Lq似然比型检验
基于EMD的MEMS陀螺仪随机漂移分析方法
抗疫中第一个获批临床试验的中药——说说化湿败毒方
一种角接触球轴承静特性分析方法
2021年《理化检验-化学分册》征订启事
中国设立PSSA的可行性及其分析方法
对起重机“制动下滑量”相关检验要求的探讨
关于锅炉检验的探讨
核安全设备疲劳分析方法与步骤
肿瘤治疗药物Tosedostat的Ⅱ期临床试验结束