混合线性模型在婴幼儿生长发育研究中的应用*

2015-03-09 06:52莉黄莉熊昌辉李洪艳谭珊高晓向仕婷林玲易娟李迪民孙振球颜
中国卫生统计 2015年1期
关键词:协方差方差月龄

张 莉黄 莉熊昌辉李洪艳谭 珊高 晓向仕婷林 玲易 娟李迪民孙振球颜 艳△

混合线性模型在婴幼儿生长发育研究中的应用*

张 莉1黄 莉1熊昌辉1李洪艳1谭 珊1高 晓1向仕婷1林 玲2易 娟3李迪民4孙振球1颜 艳1△

目的应用混合线性模型,分析婴幼儿生长发育轨迹的影响因素,建立生长发育轨迹的预测模型。方法采用SAS软件MIXED过程分析456例足月健康新生儿的生长发育资料,建立基于混合线性模型的0~12月龄婴儿体重生长轨迹预测模型。结果0~12月龄婴儿体重发育轨迹主要受出生体重、性别、喂养方式、母亲文化程度、家庭经济状况的影响。拟合的混合线性模型不仅考虑了个体内和个体间变异,还可方便地加入个体效应与其他因素的交互项,更客观地解释各因素对婴儿生长发育的影响。结论混合线性模型是研究婴幼儿生长发育规律的一种有效、实用的方法。

生长发育 婴幼儿 混合效应模型

近年来,婴幼儿的生长速率、生长发育轨迹问题备受关注,是因其能正确判断儿童的生长发育水平,早期发现生长发育异常,如营养不良、微量元素缺乏及超重肥胖等现象,从而可以及时采取干预措施,提高儿童生长发育水平。在儿童少年卫生工作中,为了动态地了解个体婴幼儿的生长发育水平,研究影响婴幼儿生长过程中的遗传、营养、环境等因素,需观察婴幼儿在各时期的身高、体重、头围等生长发育指标。这种对同一观察对象的某个(些)指标在不同时间点上多次的观察或测量数据属于纵向数据(longitudinal data)[1]。由于纵向数据是注重时间顺序的重复测量资料,同一个体的重复测量值有自相关性,且随机误差至少包括个体间的随机效应和个体内的重复测量误差,因而不满足传统线性模型中反应变量要求的独立性假定,增加了传统方法分析该类数据的难度。目前,重复测量方差分析、混合线性模型、多水平模型、潜变量增长曲线模型等可用来处理此类数据[2]。基于此,本文将探讨混合线性模型的原理及在婴幼儿生长发育轨迹影响因素研究中的应用,建立儿童生长发育轨迹预测模型,为提高儿童生长发育水平,开展儿童保健工作提供理论依据。

资料与方法

1.资料来源

采用回顾性出生队列研究的方法,在长沙市随机抽取3个社区卫生服务中心,以2013年1月1日至2013年12月31日期间出生,且在上述社区卫生服务中心建立完整健康档案的婴儿及其父母为研究对象,在取得婴儿监护人的知情同意后,将婴儿加入回顾性出生队列。查阅婴儿的健康档案及儿童保健手册,纵向收集婴儿出生后1月、3月、6月、8月、12月龄共5个时点的体重等生长发育指标。调查员经培训后,使用自制的母婴健康问卷对婴儿家长进行调查,调查内容包括新生儿及家庭成员基本情况,婴儿的喂养方式、辅食添加、患病情况、环境危险因素、孕期营养状况等。

2.模型原理

混合线性模型是一般线性模型(Y=Xβ+ε)的延伸,它保留了传统线性模型中反应变量Y满足正态性的假定,而对独立性与方差齐性不做要求,引入随机效应部分Zγ,可表现为:

式中Y表示反应变量测量值的向量,X为固定效应设计矩阵,β为固定效应参数向量,Z为随机效应设计矩阵,γ为随机效应参数向量,服从均值向量为0、方差/协方差矩阵为G的正态分布,表示为γ~N(0,G)。ε为随机误差向量,服从均值向量为0、方差/协方差矩阵为R的正态分布,即ε~N(0,R)。假定Cov(G,R)=0,即G与R间独立。这时Y的方差/协方差矩阵变为:

Y的期望值为:

混合线性模型的建模过程可以在SAS软件的PROC MIXED过程中实现[4-5]。MIXED过程默认的参数估计方法为约束最大似然法(REML),当比较随机效应相同,固定效应不同的模型时,模型估计采用最大似然法(ML)进行参数估计。模型的应用涉及随机效应变量的选取、协方差矩阵结构的选择、模型选择及拟合优度、结果的解释等[6],下面通过实例研究具体说明。

3.模型应用

本研究中资料的特点为:(1)婴儿各时点的体重,即反应变量Y,是一个重复测量资料。同一个体的体重测量值之间具有相关性,且满足正态分布。(2)具有协变量,且各测量时点为固定时点。记录调查中可能与婴儿体重变化有关的因素:如性别、月龄、出生时体重、喂养方式、是否经常患呼吸系统疾病、家庭经济状况及母亲受教育程度、父母的身高及体重、是否暴露于二手烟等。本研究的目的是探讨影响婴儿体重发育轨迹的相关生物学因素。将婴儿体重测量的各时点看作是从大量时点中随机抽取的一个样本,就可建立以时间为随机效应的混合线性模型。该时间变量既包括固定效应,又包括随机效应。建立0~12月龄婴儿生长发育轨迹的混合线性模型的步骤如下:

(1)模型的选择

首先,对数据进行探索性分析,了解婴儿0~12月龄的体重测量值随时间的平均发展趋势(average grow th trend)。本研究中,婴儿体重的平均生长曲线表现出较明显的非线性增长趋势,见图1。固定效应设定的第一步是确定时间变量月龄(month)以什么形式进入模型的固定效应部分[7]。我们可设定月龄的不同的多项式函数进行拟合,如线性、二次方和三次方的曲线生长模式。在确定基本生长曲线之后,将分析其他协变量对生长曲线的影响,如性别、出生时体重、喂养方式、患病、家庭经济状况及母亲受教育程度、父母的身高及体重等。随机效应主要考虑个体内的测量误差和个体间随机效应两方面因素,随机效应部分的设定也分为两步:①要考虑决定婴儿生长轨迹的月龄变量(月龄的一次项、二次项等)在不同婴儿间的随机变化。②选择最佳的模型方差/协方差结构。此外,确定统计模型还要考虑研究因素间的交互作用。在婴儿的生长发育模型研究中,如可考虑时间与性别、时间与喂养方式、时间与家庭经济状况之间的交互作用。

图1 0~12月龄婴儿体重测量值的平均发展轨迹

(2)协方差结构的选择

在混合线性模型中,结果变量Y的方差是通过R(残差方差/协方差)矩阵和G(随机效应的方差/协方差)矩阵分析的。对于婴儿生长发育的纵向资料,当我们把回归系数的随机变异纳入模型时,此时拟合随机效应间的协方差矩阵G的结构[8],同时假定残差方差/协方差矩阵R=σ2I,即假设残差相互独立,且残差方差相等。G矩阵结构的确定,有多种方差/协方差结构供选择,但多数情况下使用考虑无结构型(UN)[5]。

(3)拟合预测模型

①因素纳入。在无结构型(UN)方差/协方差结构下,把各协变量纳入模型分析。本资料可以看成是一个两水平的资料。反应变量Y为出生后5个时点的体重测量值,以连续变量纳入模型。月龄(month)对应每一时点的体重测量值,是第一水平的协变量。婴儿性别、出生体重、4个月内的喂养方式、患呼吸系统疾病、分娩方式、母亲受教育程度、家庭经济状况、暴露于二手烟等分类变量和父母的身高及体重等连续性变量,为第二水平的协变量。②筛选因素。模型只纳入有统计学意义的变量,而患呼吸系统疾病、分娩方式、父母的身高及体重、暴露于二手烟,这些变量无显著统计学意义,应从模型中剔除。③交互作用。考虑到婴儿性别、4个月内的喂养模式、家庭经济状况与时间可能存在交互效应,在模型中引入三个二次项:婴儿性别与时间的交互项、4月龄婴儿喂养模式与时间的交互项、家庭经济状况与时间的交互项,其中家庭经济状况与时间的交互项无统计学意义,故从模型中剔除,得到最终的拟合模型。

结 果

1.数据基本情况

共收集456例婴儿0~12月龄的生长发育资料,其中男婴224例,女婴232例。男女婴儿体重随月龄增大而增长,其均值及标准差见表1,同一月龄男婴的平均体重高于女生,且标准差均随月龄的增加而增大。

表1 456名健康婴儿0~12月龄体重测量值(均值±标准差)

2.婴儿体重测量值随时间的变化趋势

分别设定时间变量月龄的线性、二次方、三次方、四次方多项式函数模型,且不限制模型残差的方差/协方差结构。各模型拟合的统计量信息见表2,其中以三次方模型的拟合效果最好(-2Log Likelihood、AIC及BIC在所有模型中越小越好)。四次方和二次方模型拟合效果次之,且拟合效果相对于线性时间趋势模型有显著改善。由于月龄的三次方系数很小,且三次方模型拟合信息与二次方模型差别不大,实际应用中为简化模型,这里考虑使用二次方的曲线模型作为拟合婴儿的生长发育轨迹的基础模型。

表2 各种模型的拟合优度信息量(最大似然估计法)

3.模型拟合结果

采用默认的最大似然估计法(ML)估计参数,经过2次迭代后收敛,模型拟合的统计量显示:-2Log Likelihood=1140.4,AIC=1180.4,BIC=1239.6,为最佳拟合模型。选择的UN结构有3个随机效应,分别为随机截距的方差估计值:UN(1,1)=0.0831(P<0.0003),表示体重测量值的初始水平在各婴儿之间有显著差异;月龄的随机斜率的方差估计值:UN(2,2)=0.0078(P<0.0080),表示体重测量值随月龄的变化率在各婴儿间也是显著不同的;随机截距和斜率间的协方差估计值:UN(2,1)=0.0042(P<0.0001),表示婴儿的初始体重值越大,其体重随时间的变化率也越大。残差的方差估计值为0.1883(P<0.0001),说明在模型设定了随机截距和斜率后,仍存在显著的个体内变异,见表3。

表3 协方差参数估计值

模型的固定效应参数估计值见表4。由表4可知,0~12月龄婴儿体重测量值主要受出生体重、性别、喂养方式、母亲文化程度、家庭经济状况的影响。性别对婴儿体重的影响显著,且存在和时间的交互作用,出生时男婴的平均体重比女婴重0.1430kg,3月龄时男婴的平均体重比女婴重0.1430+3×0.0484=0.2882kg,12月龄时男婴的平均体重比女婴重0.1430+12×0.0484=0.7238kg。4月龄纯母乳喂养的婴儿与混合喂养的婴儿比较,其体重均值存在显著差异,在4月龄时,纯母乳喂养的婴儿平均体重值高于混合喂养婴儿0.1825-4×0.0225=0.0925kg,随婴儿月龄的增长,纯母乳喂养婴儿的体重均值较混合喂养婴儿逐渐降低,9月龄后混合喂养婴儿体重均值逐渐高于纯母乳喂养婴儿。母亲受教育程度为硕士及以上的婴儿,其平均体重值比母亲受教育程度为高中/中专及以下的婴儿高0.1193kg。家庭人均月收入在10 000元以上的婴儿,其平均体重值比家庭人均月收入在2000元以下的婴儿高0.3322kg。

表4 固定效应的参数估计值及假设检验结果

4.预测模型

拟合的混合线性模型可作为0~12月龄婴儿体重发育轨迹的预测模型,简单表示为:体重值(Y)=截距项(β0)+β1×月龄+β2×月龄平方+β3×出生时体重+β4×性别+β5×4月龄喂养模式+β6×母亲受教育程度+β7×家庭经济状况+β8×月龄×性别+β9×月龄×4月龄喂养模式+ε,ε为个体变异。

讨 论

婴儿期的生长发育状况直接或间接地影响着儿童期、青春期乃至成年后体格的继续发育,因此,关注个体婴幼儿的生长发育速率和轨迹有重要意义。体重是婴幼儿早期发育的重要监测指标之一,以往研究婴幼儿生长发育影响因素时,多采用某一时点的体重值或两次测量的体重增长值作为因变量,而没有连续地、动态地分析体重值变化的影响因素。本研究采用纵向研究的方法收集0~12月龄婴儿的生长轨迹数据,利用混合线性模型来探讨生长发育的影响因素。

本研究采用月龄计算时间变量,因而与时间有关的参数估计值较小,但仍有统计学意义。0~12月龄婴儿的体重发育呈二次曲线增长模式,与施家有等[9]拟合的0~12月龄婴儿体重呈对数曲线方程走势大致相同,揭示了随月龄增大婴儿增长速率减慢的规律。婴儿的生长发育水平受多方面因素的影响。性别对婴儿体重增长的影响是遗传因素影响生长速率的表现之一[10],随月龄增大男婴的生长速率较女婴有增高的趋势,Hosseini等的研究表明男婴从出生到2岁的体重均值高于女婴[11]。本研究中纯母乳喂养儿在9月龄前的体重均值高于混合喂养儿,之后混合喂养儿的体重均值更高,提示纯母乳喂养婴儿早期生长速率较快,与武汉市0~2岁儿童的体重指数预测模型的研究结论相似[12],可能是因为早期纯母乳喂养为婴儿的发育提供了优质蛋白、微量元素及免疫球蛋白等。此外,家庭的经济状况不好和母亲文化程度较低会限制婴儿生长速率的增加,影响生长轨迹曲线的增长。有研究表明,家庭的经济状况和母亲的文化程度可通过生活方式、居住条件、喂养行为、父母性格及对子女的态度等,直接或间接影响婴幼儿的生长发育[13-14]。由于不同地区经济、文化的差异可导致婴幼儿生长模式的不同,建立适合长沙市社区0~12月龄婴儿生长发育预测模型,并确定各因素对生长发育的影响随月龄的变化趋势,对开展儿童的生长发育监测,提高儿童生长发育水平有深远意义。本研究拟合的预测模型还需在实际工作中进一步验证和完善。

在婴儿体重的纵向测量数据中,同一个体不同时点的测量值存在相关性,且重复测量值的方差会随时间而变化,增加了传统方法分析的难度。本文通过运用混合线性模型对G和R矩阵拟合合适的方差/协方差结构,解决了该难点。由于混合线性模型不仅能定量地分析婴儿生长发育的影响因素,包括固定效应参数、个体间随机效应和个体内的测量误差;还可以方便地加入解释变量和因素之间的交互效应,更客观地分析研究问题,因而能广泛应用于生长发育资料及其他重复测量资料。

1.陈长生,徐勇勇,曹秀堂.医学研究中重复观测数据的统计分析方法.中国卫生统计,1996,13(6):55-58.

2.秦正积,沈毅,王燕南,等.三种重复测量资料的统计分析方法比较研究.中国卫生统计,2014,31(3):542-545.

3.龚清海,张晓宏,徐琛玮.混合效应模型在系统分组资料中的应用及SAS实现.中国卫生统计,2009,26(6):577-579.

4.张岩波,何大卫,刘桂芬,等.一般混合线性模型SAS的MIXED过程实现——混合线性模型及其SAS软件实现(一).中国卫生统计,2001,18(4):207-210.

5.SAS Institute Inc.SAS/STAT 9.2 User′s Guide.Version 9.2.Cary,NC:SAS Institute Inc,2008:4337-4340.

6.涂松林.混合线性模型的应用.中国医院统计,2006,13(1):70-75.

7.宋时歌,陈华珊.纵贯性数据与生长模型在社会科学实证研究中的应用.社会学研究,2005,(05):69-91.

8.姚宁,曾庆,李革,等.重庆地区儿童尿碘重复测量数据混合线性模型研究.广东微量元素科学,2010,17(5):25-30.

9.施家有,刘树琼,方为群,等.0~12月龄正常婴儿生长速率纵向监测分析.中国儿童保健杂志,2010,18(6):465-466.

10.张瑞,王惠珊,黄小娜.影响婴幼儿生长速率的生物学因素研究现状.中国妇幼健康研究,2008,19(3):256-257.

11.Hosseini SM,Maracy RZ,Sarrafzade S,et al.Child Weight Grow th Trajectory and its Determinants in a Sample of Iranian Children from Birth until2 Years of Age.Int J Prev Med,Mar 2014,5(3):348-355.

12.郭苑.我国城市儿童0-2岁期间生长发育水平和体重指数Z值预测模型及轨迹研究.武汉:华中科技大学,2013:1-59.

13.窦洪琴,赫妍.家庭和父母因素影响儿童生长发育水平分析.中国初级卫生保健,2012,26(2):46-47.

14.Kabiri M,Parsinia M,Goodarzi M,et al.Relation between physical grow th of0-2 year-old children and socioeconomic and educational situation of their parents in Karadj/Iran.Iran J Pediatr,2003,13:47-52.

(责任编辑:郭海强)

Application of Linear Mixed Model in Researches of Infant Grow th

Zhang Li,Huang Li,Xiong Changhui,et al(School of Public Health,Central South University(410078),Changsha)

ObjectiveTo investigate determinants and establish a prediction model of infant grow th trajectory based on linear mixed model.MethodsWe used the MIXED procedure of SAS software to analyze the grow th data of456 cases of fulltime healthy newborns,and to establish a prediction model of weight grow th trajectory of infants from birth until 12 months of age.ResultsBirth weight,gender,feeding mode,maternal education,and family economic status had a significant effect on weight grow th trajectory of infants from birth until12months of age.The linear mixed model fitting not only considered the variations within and between individuals,but also added the interactions between the individual effects and other factors easily,which could explain the impact of various factors on infant growth more objectively.ConclusionThe linear mixed model is an effective and practical method to study the rule of grow th and development of infants.

Grow th;Infants;Linear mixed model

*:国家自然科学基金资助(81373101)

1.中南大学公共卫生学院流行病与卫生统计学教研室(410078)

2.长沙市四方坪街道社区卫生服务中心

3.长沙市新河街道社区卫生服务中心

4.长沙市东风路街道社区卫生服务中心

△通信作者:颜艳,E-mail:yanyan@csu.edu.cn

猜你喜欢
协方差方差月龄
概率与统计(2)——离散型随机变量的期望与方差
舍饲西门塔尔母牛育成期和青年期养殖模式分析
小于胎龄儿0~24月龄体格生长状况分析
湖州33月龄男童不慎9楼坠落上海九院对接“空中120”成功救治
方差越小越好?
计算方差用哪个公式
高效秩-μ更新自动协方差矩阵自适应演化策略
基于高频数据的大维金融协方差阵的估计与应用
用于检验散斑协方差矩阵估计性能的白化度评价方法
方差生活秀