条件脆弱模型在评价癫痫复发事件数据中的应用及实现*

2013-09-07 09:02罗天娥赵晋芳刘成芳刘桂芬
中国卫生统计 2013年5期
关键词:残差癫痫异质性

罗天娥 赵晋芳 萨 建 刘成芳 刘桂芬△

条件脆弱模型在评价癫痫复发事件数据中的应用及实现*

罗天娥1赵晋芳1萨 建1刘成芳2刘桂芬1△

目的 探讨条件脆弱模型在癫痫复发事件数据中的应用及软件实现。方法 利用癫痫复发数据构建条件脆弱模型,采用惩罚偏似然函数进行参数估计、并与共享脆弱模型和Cox比例风险回归模型进行对比分析。结果 条件脆弱模型分析复发数据既考虑复发时间的非独立性也考虑了异质性问题,可以用来评价癫痫复发临床疗效,结果解释合理,软件容易实现。结论 条件脆弱模型可以较好分析复发数据,值得推广应用。

条件脆弱模型 惩罚偏似然 癫痫复发 复发事件数据

*:国家青年科学基金项目资助(编号81001294);山西医科大学青年基金资助(02200913)

1.山西医科大学卫生统计教研室(030001)

2.山西医科大学解剖教研室

△通信作者:刘桂芬,E-mail:liugf66@126.com

生物医学研究中常常对反复发作的医学事件及其影响因素感兴趣,如反复感染、反复住院、肿瘤的复发等,这类同一事件在同一受试对象上反复发生的数据,称为复发事件数据(recurrent event data)〔1-3〕,该资料不仅记录事件是否反复发作,还需记录反复发作的时间间隔。复发事件资料的主要特点是同一结局反复发生、复发时间有删失情况、具有非独立性和异质性的特点。因此,常用的针对生存资料的Cox比例风险回归模型就不再适用。目前的复发数据的统计分析方法主要有脆弱模型和方差校正模型。本研究拟采用条件脆弱模型来评价癫痫复发事件数据的临床疗效及R软件实现,并与共享脆弱模型和Cox比例风险回归模型进行对比分析。

原理和方法

1.条件脆弱模型

脆弱模型(frailty models)〔4〕是包含随机效应的比例风险模型,脆弱性即模型中的随机效应,模型利用脆弱因子来描述生存时间的相关性。共享脆弱模型(shared frailty models)〔5-6〕假定同组个体或同一个体在不同时点具有相同的脆弱,即“共享”脆弱,在此条件下满足比例危险假定。

条件脆弱模型(conditional frailty model)〔7-8〕是基于事件进行分层,同时引入随机效应即脆弱项,来分析复发事件数据的非独立性和异质性;同一个体复发事件的相依性可用事件分层,即通过改变第k次事件的基线风险来反映,数据模式是把总时间按事件的复发次数分为多个时间段,风险集的定义是第k-1次事件发生后,k次事件才有发生的风险,参数估计解释为即k-1次事件开始发生到第k次事件发生的风险估计;个体间异质性用随机效应来反映,针对右截尾失效时间个体i发生第k次事件的风险,用hik表示,建立条件脆弱模型如下:

式中,k表示第k次复发事件数,h0k是基线风险函数,可以随k不同而改变,解释事件依赖性,如果h0k=h0,表示事件间无依赖性,如果h0k=kh0,表示事件间有依赖性存在;t-tk-1表示从前一次即k-1次事件开始发生到第k次事件发生的间隔时间,X表示自变量,可以是分类变量也可以是随时间变化的时依协变量,β是各协变量对应的回归系数,ui=exp(ωi)表示个体i的随机效应或脆弱项,即个体i在所有的复发时间里共享一个脆弱项,解释异质性的存在,如果ω=0,表示没有未观测的异质性存在,如果ω~N(0,1)则有异质性存在,θ是u的方差,它越大表示异质性程度越大。

2.参数估计

惩罚偏似然(penalized partial likehood,PPL)方法〔9-12〕与EM算法相似,脆弱项被认为是受惩罚函数约束,避免不同组脆弱间差异太大,计算上与其他惩罚回归的收缩估计(shrinkage estimator)方法相似,如岭回归(ridge regression)和光滑样条(smoothing splines),该方法收敛速度较快。

惩罚偏似然函数是Cox回归偏似然函数的修饰函数,回归系数和脆弱项被包括到风险函数里进行优化。该模型的惩罚偏似然函数为:

第一项是条件脆弱模型的偏似然函数:

式中,k表示复发事件数,δ是截尾变量(δ=1表示完全数据,δ=0表示截尾数据),Y是风险指示变量(Y=1表示个体在第k次事件处于风险状态,Y=0表示个体未处于风险状态)。

第二项是Gamma脆弱的惩罚项:

f是惩罚函数用来限制ω,θ是Gamma脆弱分布的方差,组内相关性用τ=θ/(2+θ)表示。参数估计时,首先设定脆弱值为1进行模型拟合,然后将脆弱项作为固定或已知的参数,第一步通过迭代对偏似然函数进行优化;第二步,利用现有观测值将脆弱项作为条件均数进行评估,如此重复直到收敛。该法的优点是计算简单,可以快速达到优化。

3.基于Schoenfeld残差比例风险假定的作图法和检验法

利用Schoenfeld残差图检验是否满足比例风险假定,Schoenfeld(1982)〔13〕定义偏残差ri=(ri1,ri2,…,rik)',rik=Xik-E(Xk|Ri),即第k个变量ti时刻的偏残差Xik的观察值与给定危险集Ri下条件期望之差;Schoenfeld残差不是每个个体有一个独立的残差,而是每个个体在每个协变量下有一个单独的残差。

实例分析

在一项临床试验〔12〕研究中,将254例癫痫病人按随机双盲法分为阳性药物组和安慰剂对照组,从癫痫病人进入试验开始记录其第一次癫痫发作和第二次发作的间隔时间,随访一年后中止试验。复发事件数据以计数过程的输入方式记录,例如一个个体有三次复发和一次截尾共有四次观测,每次观测有一个起始时间和一个终止时间,需要一个事件指示变量说明终止时间是复发时间或是截尾时间。数据格式见表1及变量赋值见表2。

表1 254例癫痫病人反复发作部分数据

表2 变量赋值表

用R 2.15.1版免费软件来拟合Cox比例危险模型、共享Gamma脆弱模型和条件共享Gamma脆弱模型,程序编辑如下:

表3 癫痫复发数据不同模型结果比较

结果整理见表3,可见共享伽玛脆弱模型和条件脆弱模型的标准误均大于Cox比例危险回归模型,条件脆弱模型的标准误最大,这表明由于Cox比例危险回归模型没有考虑复发事件相关性的存在,导致方差低估,可信区间变窄,得出不满足比例风险假定的结论;共享伽玛脆弱模型和条件脆弱模型均显示脆弱方差有统计学意义,说明个体间异质性存在,并且满足比例风险假定;因 χ2= -163.2,P<0.001,说明条件脆弱模型优于共享脆弱模型,条件脆弱模型不但解释了个体间的异质性,同时也考虑个体内的相关性。条件脆弱模型结论是不同组别癫痫病人复发风险差别有统计学意义( β=-0.990,P=0.0002),阳性试验组癫痫患者复发风险是对照组的0.372倍。脆弱项方差θ=2.27,P=0.0002,随机效应有统计学意义,说明个体间异质性存在,组内相关性估计τ=θ/(2+θ)=0.53。Schoenfeld残差图(图1),说明该资料符合条件比例风险假定。

图1 Schoenfeld残差图

讨 论

临床试验研究中为探讨不同药物的治疗效果,进行安全性评定癫痫病人的生存时间与生存质量,常用事件发生等待时间来评价。含有删失数据的生存分布比较中,对于单一生存事件分析已经有各种各样的参数和非参数的统计分析方法,但对于复发事件数据分析的模型仍处于研究中。

用于分析复发事件数据的模型有方差校正模型和脆弱模型等。方差校正模型〔14〕包括AG模型、条件模型和边际模型,前提是假设数据由独立事件组成,参数估计后用稳健标准误来校正复发事件带来的标准误的下偏。所以该模型不能解决由于个体间的异质性引起的事件时间非独立而导致的偏移效应。

脆弱模型是目前最受关注的一种解释异质性存在模型,假设异质性是客观存在的,用脆弱描述子组中个体生存时间之间存在的相关性,不同的个体有不同的脆弱,意味着某些个体或多或少地易于经历事件,相关个体被认为具有相同倾向,但是这种相同倾向的来源是未知的,不可测量或是未测量的;脆弱实际上是一个随机效应,通过将随机效应引入生存数据模型,就可以解释个体间不能被观测的协变量引起的异质性,脆弱模型只能解释异质性而不能解释个体内的相关性。

本文探讨用条件脆弱模型来分析复发事件数据,既可以解释个体内相关性,又能解释个体间异质性。条件脆弱模型可以比较客观地分析癫痫复发数据,结果解释客观,软件容易实现。研究表明如果事件依赖性存在,必须对不同的事件估计不同的基线风险,即根据事件数分层,若强行估计随机效应,反而会带来结果的偏移;如果异质性存在,必须估计随机效应,若估计了不同的基线风险函数同样会带来结果的偏移;对于一份实际数据,我们还没有信息知道它是否存在异质性和相依性,或者两者同时存在时,建议采用条件脆弱模型进行分析,它可以捕获相依性和异质性效应。

1.Clayton DG.Some approaches to the analysis of recurrent event data.Statistical Methods in Medical Research,1994,3(3):244-262.

2.Kelly PJ,Lim LY.Survival analysis for recurrent event data:an application to childhood infectious diseases.Statistical in Medicine,2000,19(1):13-33.

3.Hyun JL,Liu JX,Marlene ML.Comparison of methods for analyzing recurrent events data:application to the emergency department visits of pediatric firearm victims.Accident Analysis & Prevention,2007,39(2):290-299.

4.Clayton DG.A model for association in bivariate life tables and its application in epidemiological studies of familial tendency in chronic disease incidence.Biometrika,1978,65:141-151.

5.Roberto G.Gutierrez.Parametric frailty and shared frailty survival models.The Stata Journal.2002,2(1):22-44.

6.罗天娥,刘成芳,赵晋芳,等.共享伽玛脆弱模型在癫痫复发的应用及实现.中国卫生统计,2012,29(2):175-176.

7.Box-Steffensmeier JM,De Boef S.Repeated events survival models:the conditional frailty model.Statistical in Medicine,2006,25(20):3518-3533.

8.Janet MB,Suzanna DB,Kyle AJ.Event dependence and heterogeneity in duration:the conditional frailty model.Political Analysis,2007,15(3):237-256.

9.Duchateau L,Janssen P.The frailty model(Statistics for Biology and Health).Springer:2007.

10.Rondeau V,Gonzalez JR.Frailtypack:a computer program for the analysis of correlated failure time data using penalized likelihood estimation.Computer Methods and Programs in Biomedicine,2005,80(2):154-164.

11.Janet M Box-Steffensmeier,Suzanna De Boef.Repeated events survival models:the conditional frailty model.Statistics in medicine,2006,25(20):3518-3533.

12.Philip Hougaard.Analysis of Multivariate Survival Data.New York:Springer-Verlag,2000.

13.Miscellanea.A note on scaled schoenfeld residuals for the proportional hazards model.Biometrika,2001,88(2):565-571.

14.余松林,向惠云.重复测量资料分析方法与SAS程序.北京:科学出版社,2003.

Application of Conditional Frailty Model for Epileptic Seizures and Implement

Luo Tiane,Zhao Jinfang,Sa Jian,et al.Department of Health Statistics,Shanxi Medical University(030001),Taiyuan

ObjectiveTo explore the applications of conditional frailty models in recurrent event data about epileptic seizures and software implement.MethodsCollecting the epileptic seizures data,establishing the conditional frailty models,parameters of the estimate are calculated by penalized partial likehood function,and comparing with shared frailty models and Cox proportional hazard models.ResultsThe conditional frailty models are best account for the heterogeneity and event dependence,we can evaluate the clinical effect of epileptic seizures data using conditional frailty models,the explain is reasonable,the implement of software is easy.ConclusionConditional frailty models are useful for analyzing recurrent events data,it deserves to be widely applied.

Conditional frailty model;Penalized partial likehood;Epileptic seizures;Recurrent event data

(责任编辑:郭海强)

猜你喜欢
残差癫痫异质性
Meta分析中的异质性检验
18F-FDG PET/CT代谢参数及代谢异质性与胃癌临床病理特征的相关性
基于双向GRU与残差拟合的车辆跟驰建模
基于可持续发展的异质性债务治理与制度完善
探讨中医综合疗法治疗脑卒中后癫痫疗效
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
本体支持的生物医学领域元数据异质性与可兼容性研究
玩电脑游戏易引发癫痫吗?
综合电离层残差和超宽巷探测和修复北斗周跳