重复测量计数资料的随机效应ZINB模型*

2011-03-11 14:01赵丽华刘桂芬田娇妮
中国卫生统计 2011年6期
关键词:离体灌流计数

赵丽华 刘桂芬 田娇妮

Poisson模型是计数资料分析的基础模型,但在医学研究中,经常会遇到某事件发生次数的资料中含有大量的零,即观察个体在单位时间、单位体积内未观察到相应事件的发生次数。大量的零计数存在,且其比例超过Poisson分布的预测概率。Cohen(1963)、Johnson 和 Kotz(1969)早就注意到零过多现象〔1,2〕,但直到20世纪90年代,Lambert(1992)才首次建立了协变量零膨胀Poisson模型,并探讨了参数极大似然估计及大样本性质〔3〕。Greene(1994)提出了模型参数方差的BHHH估计,应用ZINB模型研究了消费者银行信用卡不良记录资料〔4〕。Greene(2000)将零膨胀模型引进了新版的Limdep 7.0中〔5〕。近年零膨胀模型逐渐地被应用到交通、政治、微观经济等研究领域中,本文引入随机效应ZINB模型,阐明医学领域零过多和过度离散问题并存时重复测量计数数据的分析方法及其应用。

模型原理介绍

1.固定效应ZINB模型(FE-ZINB)

ZINB模型的基本思想是把某事件发生次数看成两个过程:第一过程对应零事件的发生,假定零事件以概率pi发生,在这个过程中认为个体取值为0或非0,因此能够解释数据中可能存在的过多0的原因;第二过程对应事件数的发生过程,假定对应事件数以概率1-pi发生,在这个过程中个体的取值可以为0或正的事件数,并且服从均值为λi的负二项分布。

FE-ZINB模型的概率分布如下:

2.随机效应ZINB模型(RE-ZINB)

重复测量资料是指同一个体在不同时点或部位多次测量得到的,由于同一个体j个观察值间存在相关性,提供的信息量不及j个独立的观察值,相关性越高,提供的信息量就越少。分析中若忽略资料的非独立性,有可能导致错误的分析结论〔6〕。

设 yij为第 i个体第 j次的观察值,i=1,2,3,…,n,j=1,2,3,…,k,随机效应 ZINB 模型可表示为

当α→0时,RE-ZINB模型就退化为RE-ZIP模型。

随机效应ZINB模型记作

模拟研究

假定计数反应变量yij服从如下的混合概率分布〔7〕:

表1 模拟数据三种模型参数估计结果

由于RE-ZINB模型考虑了随机效应、数据中存在过多零计数以及过度离散问题,表1可见RE-ZINB参数和pij的估计值都很接近模拟真值,拟合结果最好。固定效应ZIP模型虽考虑了过多零计数,但忽略了随机效应,这样增大了自由度,而导致高估常数项和pij。随机效应ZIP模型虽考虑了随机效应但忽略了数据的过度离散,其结果低估了常数项。由此若计数资料存在相关结构,应考虑随机效应模型;若还存在零计数过多以及过度离散问题时,选择随机效应ZINB模型拟合较好。

实例分析

某研究组采用离体心脏灌流实验,探讨A(对照药)、B(处理药物1)、C(处理药物2)三种药物的药效关系。随机抽取月龄相同体重相近的大白鼠36只,随机分为3组,处死大白鼠取心脏置于离体心脏灌流液实验装置中,观察不同药物对离体心脏活动的影响。取前五分钟内心律不齐的平均次数作为每只老鼠的基线指标,分别在灌流液中加入一定剂量的A、B、C三种药物后,每隔一分钟记录大鼠心律不齐发生的次数,连续观察并记录10次。整个实验过程中人工控制实验灌流装置,保证离体心脏在观察期间内灌流压力、温度、酸碱度等存活条件及药物浓度保持不变。

大鼠离体心脏灌流实验心律不齐平均发生次数为1.567次,离体心脏心律不齐次数的统计描述见表2,心律不齐次数的均数和方差相差较大,这可能是由于数据中存在的0次心律不齐比例过多而导致的。本实验观察心律不齐发生0次数的频率为46.94%,而理论Poisson与负二项分布的零概率分别为20.87%和38.96%,远远低于实际频率,因此对心律不齐发生次数资料不能简单地拟合基础计数模型,而应建立随机效应零膨胀计数模型,模型拟合结果见表3。

表2 离体心脏心律不齐次数的统计描述

离体心脏心律不齐数据的四种模型拟合优度指标表明(表3),RE-ZINB模型BIC值最小,而AIC和LL指标结果与BIC结果相同,仍以RE-ZINB最优。结合资料数据结构和专业知识,我们认为,对于离体心脏心律不齐数据,拟合RE-ZINB模型效果最优。RE-ZINB模型负二项部分的随机效应有统计学意义,表明不同大鼠心律不齐发生次数差别有意义。

表3 离体心脏心律不齐数据的四种模型拟合结果评价

离体心脏心律不齐数据的四种模型参数估计结果表明(表4),RE-ZINB模型中logistic回归参数估计表明大鼠试验前的基础心律不齐次数是影响大鼠在实验中是否发生心律不齐的因素,基础心律不齐次数越高的大鼠在试验中越有可能发生心律不齐(t=-∞,P<0.001)。负二项部分参数估计可见,时间对心律不齐发生次数的影响有统计学意义(t=-4.12,P<0.001),随检测时间的延长心律不齐发生次数减少;与A药相比,C药的效应差别有统计学意义(C药物:t=-2.94,P=0.0058),即使用C药的大鼠心律不齐发生次数较A药少;试验前基础心律不齐次数越高的大鼠心律不齐发生次数也越多(t=3.25,P=0.0026)。

Parameter ZIP ZINB RE-ZIP RE-ZINB logistic过程 Constant -0.3116 0.03387 -0.3611 -0.4603 Time 0.008710 -0.06617 -0.02997 -13.2857 Base -0.4634* -41.0027** -0.3754 -19.2211**Drugb -0.02309 -0.2881 -0.1807 0.3804 Drugc 0.1984 -13.3289 -0.09727 -5.7501计数过程 Constant 1.6086** 1.3838** 1.3789** 0.8127*Time -0.09835** -0.09736** -0.1084** -0.09763**Base 0.2236** 0.2015* 0.3201* 0.4454*Drugb -0.4732** -0.4613* -0.4911* -0.3964 Drugc -0.8168** -1.1371** -0.8913* -0.8249*随机效应参数(S2u)0.2017* 0.2702*离散参数(K) 0.9096** 0.9349**

小 结

零膨胀计数模型将研究总体分成两组不同的个体:一组中的个体根本不会发生相应的事件,另一组中的个体可能发生事件并假定服从负二项分布,将数据中的零看成“过多的零”和“真实的零”;但对重复测量或个体观察值存在聚集性,同一个体间数据存在相关性时,即不满足零膨胀独立性的要求时,固定效应零膨胀模型的应用受到限制。本文将重复测量的个体看作随机效应,建立随机效应ZINB模型,不仅将固定效应ZINB模型扩展到能够适合于重复测量数据,解决计数资料中零过多问题,也考虑了个体间随机效应,能够得到比FE-ZINB和RE-ZIP拟合更合理、精度更高的结果。

采用RE-ZINB模型分析药物前期临床试验离体心脏心律不齐研究数据,结果表明大鼠的基础心律不齐次数是大鼠药物试验中是否发生心律不齐的影响因素,提示初期是否有心律不齐,对用药后结果有影响;试验用C药组大鼠心律不齐发生次数较用A药组少,即试验用C药控制心律不齐发生次数效果优于对照组(A药);随用药时间延长,心律不齐发生的次数逐渐减少,但基础心律不齐者减少发生的次数幅度较小。

本文只在计数过程引入了随机效应,对于两过程,即logistic过程和计数过程都引入随机效应还需进一步研究。

1.Cohen AC.Estimation in mixture of discrete distributions.In Proceedings of the International Symposium on Discrete Distributions,Montreal,1963:373-378.

2.Johnson NL,Kotz S.Distributions in Statistics:Discrete Distributions.Houghton Mifflin,Boston,1969.

3.Lambert D.Zero-inflated poisson regression with an application to defects in manufacturing.Technometrics,1992,34:1-14.

4.Greene W.Accounting for excess zeros and sample selection in Poisson and negative binomial regression models.Working Paper No.EC-94-10,Department of Economics,Stern School of Business,New York University,1994.

5.Greene WH.Econometric Analysis,Upper Saddle River,NJ:Prentice Hall,2000.

6.Long JS.Regression Models for Categorical and Limited Dependent Variables.Thousand Oaks:Sage Publications,Inc,1997.

7.van den Broek J.A score test for zero inflation in a Poisson distribution.Biometrics,1995,51:738-743.

8.SAS/ETS 9.2:User's Guide.2008,SASInstitute Inc.,Cary,NC,USA.

9.Cameron AC,Trivedi PK.Regression Analysis of Count Data,Cambridge:Cambridge University Press,1998.

猜你喜欢
离体灌流计数
古人计数
微流控芯片细胞灌流培养技术及其应用研究进展
治疗尿毒症新型血液灌流吸附剂体外实验研究
递归计数的六种方式
血液灌流联合血液透析治疗银屑病疗效观察
古代的计数方法
长白落叶松离体再生体系的建立
结绳计数
切花月季‘雪山’的离体快繁体系的建立
灵魂离体