二值纵向数据的经验似然分析

2020-07-13 07:36尹长明靳永涛王亚东

广西大学学报（自然科学版） 2020年3期

尹长明,靳永涛,王亚东

(广西大学数学与信息科学学院, 广西南宁 530004)

0 引言

二值数据是指响应变量的观测结果有两种情形，例如观测某人是否有心血管疾病，银行对某个客户是否贷款，学生考试是否及格等。纵向数据是对一个个体进行多次观测的数据，其中对一个个体多次观测的数据之间是相关的(相关系数不知道)，而不同个体观测的数据之间是独立的。LIANG等[1]提出的广义估计方程(generalized estimated equation, GEE)方法是对纵向数据进行分析的重要工具，研究文献很多[2-5]。广义估计方程的一个重要性质是即使工作相关系数假设错误，得到的估计仍然是相合的和渐近正态的。若工作相关系数等于真实相关系数，得到的估计渐近方差最小。经验似然也是一种重要的数据分析方法，有很多突出的优点，如用经验似然构造置信区间除有域保持性，变换不变性及置信域的性质由数据自行决定等诸多优点外，还有Bartlett纠偏性及无须构造轴统计量等优点[6-9]。QIN等[6]用经验似然方法研究了独立同分布的广义估计方程，LI等[7]用经验似然方法研究了广义线性模型下的广义估计方程，但条件不易验证，其结果也不理想。

下面将在易验证和比较弱的条件下证明二值纵向数据下经验似然估计的渐近性质。

设对第i个个体的第j次观测后同时得到一个二值响应变量Yij和一个p×1维协变量Xij(i=1,…,n,j=1,…mi)。设不同个体之间观测的数据是独立的，同一个个体mi次观测的数据是相关的。XT表示X的转置,记Yi=(Yi1,…,Yimi)T,Xi=(Xi1,…,Ximi)T。假设Yij期望为：