结构方程模型的构建及AMOS软件实现*

2018-12-29 03:59复旦大学公共卫生学院流行病学教研室公共卫生安全教育部重点实验室200032
中国卫生统计 2018年6期
关键词:参数估计修正方程

复旦大学公共卫生学院流行病学教研室,公共卫生安全教育部重点实验室(200032)

方绮雯 刘振球 袁黄波 蔡 宁 何 纳 张铁军△

结构方程模型(structural equation modeling,SEM),又称协方差结构模型(covariance structure modeling,CSM)、线性结构方程(linear structural equation,LSE),是由因子分析(factor analysis)与路径分析(path analysis)发展而来的高级统计方法。自瑞士统计学家、心理测量学家Karl G.Joreskog于 20世纪70年代初提出初步算法[1-2],该模型在社会科学等领域不断进行实践,目前依然是应用统计学科的研究热点。作为一种整合了因子分析与路径分析的多变量统计手段,结构方程模型具有传统统计学方法所不具备的优势,然而现阶段国内结构方程模型的应用还不够广泛,其模型理论概念、以及软件实现方面的文献较为缺乏。故本文从实践角度应用AMOS软件实现结构方程模型构建,并对涉及到的较易混淆以及难以理解的概念作出解释。

原理方法

实例步骤

以一项在某地区流动人口当中进行的艾滋病自愿咨询和检测(voluntary HIV counselling and testing,VCT)意愿的影响因素研究为例,其潜在影响变量,包括调查对象年龄、性别、文化程度、人口流动性以及对于艾滋病的KAP情况之间存在一定关联,且问卷量表的调查方法对变量测量可能存在误差。传统的回归分析方法不能很好地考虑并解决这些问题,故此处拟采用SEM方法对VCT意愿的影响因素进行分析建模。来源数据中变量的具体测量见文献[3],简要变量赋值情况如表1所示。

1.构建模型框架图

根据专业知识与文献调研结果理清待分析变量之间的关系,确定初始的假设模型,利用AMOS软件左侧的绘图工具进行模型框架图绘制。

2.模型估计

AMOS软件提供五种方法以供选择,其中最大似然法(maximum likelihood,ML)是AMOS默认的参数估计方法,应用最广,但对数据正态性要求较高。当样本量较大(最好大于500)且观察数据符合多变量正态分布时使用ML法最为合适;若观察数据为大样本,但不满足多变量正态分布时,推荐使用广义最小二乘法(generalized least squares,GLS);未加权最小二乘法(unweighted least squares,ULS)是一种依赖量尺单位的估计方法,当所有观察变量以相同的单位测量时,采用该法可获得最适当的估计结果[4]。本例采用GLS法对模型参数进行估计。

3.模型适配度检验

饱和模型与过度识别模型虽皆可识别,但饱和模型对模型中包含的所有变量间的两两关系进行参数估计,此时其整体适配度卡方值与模型自由度等于0,卡方值的显著性概率值无法计算。另外需要注意的是,适配度指标评价的是假设模型与搜集的数据是否相互适配,而非模型的好坏。一个适配度佳的模型不一定是具备科学性的模型(见表2)。

表1 VCT调查的变量赋值

表2 VCT的SEM适配度指标摘要表

4.模型修正

模型修正必须有合理的理论依据支持,在此前提下可将不合理的或是未达到显著水平的影响路径删除,或通过一些手段提高模型适配度。模型适配度不佳的原因可能有数据的分布与样本量大小不符合所选用参数估计方法的假定;数据中有缺失值存在;需估计的自由参数太少导致模型自由度过大;构建的假设模型不合理等。当适配度检验判定数据与假设模型不适配时,可从上述角度对模型加以修正,但要注意不要过于以数据为导向违反理论基础。AMOS软件提供的修正指标(modification indices,MI)可作为改善模型适配度的参考。参数的MI值是评估释放某一参数估计对降低模型适配度卡方值贡献的指标。目前对于需要修正的MI阈值尚无一致定论,但可从释放具有最大MI值的固定参数开始,结合期望参数改变量(expected parameter change,EPC)一次修正一个参数,同时注意避免使一个可识别的模型无法识别。本例最终模型图与适配度指标分别如图2、表2所示,模型适配度指标基本符合参考标准,拟合良好。在指向VCT意愿的直接路径中,男性(P<0.001)、文化程度(P=0.032)及艾滋病KAP评分(P=0.002)的参数检验具有统计学意义。

图2 VCT意愿影响因素的结构方程模型

讨 论

本文通过简要介绍SEM的基本概念及统计分析的核心思想,并以VCT意愿的流行病学调查数据为例进行了结构方程模型构建。其基本步骤可归结为三步,即通过前期文献资料调研界定假设模型,样本数据代入模型进行参数估计,通过适配度检验根据修正指标对模型进行修正,从而最终得到一个既符合理论背景假设且适配度佳的模型。本文所构建模型由适配度指标评价与数据的契合程度良好,发现艾滋病自愿咨询检测的主要影响因素为性别、文化程度与对艾滋病的KAP情况,这与之前采用传统分析方法进行的研究结论类似[3],说明模型构建合理以及该法应用的可信度。相比之下,采用SEM进行建模,引入了不能直接观测到的潜在变量,并可在模型中估计误差变量,使得变量之间关系的刻画更加精确,根据估计的路径系数写出相应的结构方程即可对VCT意愿做出估计。与此同时,通过对路径系数的代数运算还可得到变量间的直接效应(路径系数本身)与间接效应(路径上系数乘积)以评估某一变量的总效应,从而在实施干预措施时优先对效应值较大的变量进行干预。

随着当前各领域的研究问题不断复杂化精细化,除了所关心结局事件的影响因素,人们也越来越关注影响因素之间的关联,SEM相较于一般的统计学方法能够较好地解决这类问题,具有显而易见的优势,虽然仍存在一定局限性[5],但SEM的研究方法与分析软件也顺应科学需求不断发展、日益完善,例如结合贝叶斯方法的参数估计[6],类别变量[7]、非正态数据[8]、非线性结构[9]、多水平结构数据[10]的分析处理方法正在进一步研究与发展中。随着模型理论的不断完善以及统计软件的开发,结构方程模型在医学领域必将有更广阔的应用前景。本实例通过AMOS软件进行实践操作,相较于其他SEM分析软件,如LISREL、MPLUS、CALIS、RAMONA、以及R语言相关包等,AMOS软件对于统计理论及编程的掌握要求相对较低,基于窗口点击式操作便于入门,且隶属于SPSS家族系列,便于与普遍使用的sav格式数据文件进行对接,且提供VB、SAS等软件的数据接口,方便实用。

猜你喜欢
参数估计修正方程
方程的再认识
基于新型DFrFT的LFM信号参数估计算法
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正这一天
方程(组)的由来
误差分布未知下时空模型的自适应非参数估计
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
圆的方程
软件修正
浅谈死亡力函数的非参数估计方法