基于贝叶斯层次模型对联合分析方法的改进

2022-12-16 09:44刘贺家刘东来
吉林大学学报(信息科学版) 2022年4期
关键词:后验贝叶斯百分比

李 硕,刘贺家,刘东来,李 阳

(1.吉林财经大学 a.公共管理学院;b.会计学院,长春 130117;2.吉林省会计学会,长春 130021;3.吉林省医疗保障事业管理中心,长春 130033)

0 引 言

在统计学中,联合分析方法(Conjoint Analysis)经常用于量表调查中,以分析统计总体的偏好,主要是用于模拟和衡量消费者对产品或服务质量的感知[1]。联合分析方法可与多种随机模型一起使用处理联合数据,如普通最小二乘回归模型,logit,probit,多项概率和嵌套logit或probit模型等。从20世纪90年代开始,贝叶斯层次模型(Hierarchical Bayes Model)与联合分析一起使用变得非常流行,因为能提高联合分析的可靠性,预测的有效性并可提供可靠的估计[2]。

目前,越来越多的学者使用此方法在充分考虑到大学生偏好异质性的情况下进行教育质量评估,如Kuzmanovic,Savic,Popovic和Martic等。由于受联合分析方法不能同时对大量的参数进行变量分析[3]的限制,因此大多数研究者只测试一部分教育质量评估因素,而这些属性并不能构成一个完整的教学过程。

笔者将使用与联合分析类似的实验设计,要求大学生评估课程教学和内容的某些教学因素以及整体的课程质量。通过收集数据,剔除学生对教学变量的权重设计,因为不同学生对每个教学因素的重要程度都有不同的看法。然后,构建一个贝叶斯β回归模型(Bayesian Beta Regression Model),其权重具有均匀Dirichlet分布作为先验分布以得出属性权重的后验分布,符合实验设计的设定并将构造出一个基于学生偏好的教学质量指标体系。此模型包含两个层级,第1层级是在涵盖先验信息的基础上用广义线性模型对第2层级中的参数提供可能的概率分布。贝叶斯层次模型借用其他受访者的信息,使用迭代程序以稳定每个个体的最大似然参数估计,而且可以提供稳定和准确的模型,即使所观察到的结果小于所估计的参数,该模型也可以通过将模型与干扰分离恢复异质性[4]。

1 贝叶斯层次模型的构建与MCMC算法设计

假设已经调查了nj个学生的随机样本,其中j=1,2表示调查的两个不同时间段。令n=n1+n2表示总样本大小,并且yij表示由第i个人在时间j(i=1,…,nj)给出的响应变量(总教学/课程评估分数)的观察值。令Xij=(xij,1,…,xij,k)T表示k个已知属性的矢量的观测值。令zij表示未观测到的随机变量(潜在变量),其与学生i在时间j对某些未涉及的因素的测量有关。为不失一般性,假设数据已经被缩放,因此所有上述变量都是在区间[0,1]中取值的分数。

假设响应变量遵循beta分布,其均值被建模为观察到的和未观察到的属性与更定变量的加权线性组合。模型的系数可以被解释为权重(所有权重加和为1),因此其测量学生i在时间j给予不同属性和潜在变量的相对重要性。

对于因变量的观察数据最初是以百分比呈现的,用于表示总体评估得分。目前对百分比数据建模的方法中最常用的是对百分比数据进行转化(transform)后对其进行最小二乘回归。对上述数据转化方法,通常使用反正弦平方根和logit函数。这些方法虽然在相关的数据分析中广泛应用,但通常研究者忽视了方法中的前提条件而使其模型假设没有得到满足[5]。另一种方法是使用基于二项分布的回归模型[6]。在很多情况下,基于此模型下的百分比结果被过度分散,造成其显示出比二项分布预期更大的可变性。更重要的是百分比的结果是非二项式的,例如人口未的社区占总社区的比例。为克服上述问题和限制,经常采用β回归模型(Beta Regression Model)。这是因为β分布具有高度灵活的形状,适合表示以百分比尺度测量的任意结果变量。此外,即使是基础简单的β回归模型也可以通过包含精度参数调整百分比结果的条件方差从而方便地解释其过度离散现象。在类似的问题中,Carmichael将包括β回归在内的几个模型通过教育绩效数据进行了比较,得出基于β分布的线性模型通常是最合适模拟上述类型数据的结论[7]。

基于上述观点,笔者对两个不同的时间段(j=1,2),构建模型如下

对上述模型进行模拟并且将其与更简单的(联合)模型的预测能力进行比较。该简单模型如下

下面笔者将开发相关的机器学习算法完成上述所构建模型的模拟与抽样检验。上述模型对于响应变量的假设是其应大于0且小于1。

2 调查设计、数据采集及算法应用

2.1 数据来源

该调查对象选择具有至少两年以上学习经验的本科学生,主修公共管理,并选修过20门以上的课程,学习过不同学科的教材,并且由不同的教师授课。有充分表达和分辨教学感受的能力,考虑到调查质量,其中题目应答率若低于10%,则删除该题目。学生无应答率低于10%,题目无应答率低于10%这两种情况下可忽略不计。

在调研中要求学生评价其迄今为止学习所有课程中的一些因素,并要求根据其上课的经验和感受填写能做到正面积极质量特征的课程/教师的百分比,测量尺度是定序的,对于顺序共有11个级别对应,10%宽度百分比间隔,从0~100。

课程/教师教学模块的质量通过一组14个因素测量,而这14个因素被嵌入到一个具有3级的层次模型中。在第1层,识别了两组质量因素,1组与课程相关,另一组与教师相关。在这两组内部,是第2层模型,一般因素包含进第2层模型作为主要研究问题,例如,第1组包含课程内容,教科书和评分程序等因素,第2组包含教师的教学,知识和行为等元素。在第3层,将之前设定的14个个体质量属性转化为14个单项问题。最后要求学生在可比较的测量量表中对一般课程/教学模块进行总体质量评估。

调查问卷的结构,内容选择和描述主要基于欧洲高等教育质量保证协会(2009)和希腊质量Assura(2007),Feldman类别[8]和SEEQ(Students Evaluation of Education Quality)因素[9]的原型和指南。表1中给出了15个单独的质量问题,其顺序与问卷中相应问题的顺序相同。

表1 变量描述表Tab.1 Variable description table

调查问卷的初级版本由学生样本的6名志愿者进行回答和评估,根据学生的意见和结果,修改其中问题的措辞和排序并形成最终问卷。

2.2 MCMC算法应用

贝叶斯方法在给定先验分布的条件下,仅需计算后验分布的概率密度函数即可。贝叶斯推断方法的应用受到限制的原因在于这些未知参数的后验分布大多数都是高维的、复杂的、非一般常见的分布,计算过程较难以实现[10]。而通过模拟的方式对高维积分进行计算的MCMC(Markov Chain Monte Carlo)方法出现,使原本异常复杂的高维积分计算问题变得很容易解决,从而为贝叶斯方法的应用开辟了新的思路[11]。基于上述对贝叶斯层次模型的构建,笔者首先对模型1进行拟合。在拟合过程中,对MCMC算法进行3 000次迭代(iteration),其中将前1 000次作为开始阶段的样本(burn-in period sample)。算法流程如下。

Algorithmic Flow of MCMC Based on Bayesian Hierarchical Model

1:

2:iter←3 000▷Number of Sampling Iteration

3:burnin←1 000▷Sufficiently large burn-in period

4:

5:declarea▷Shell of length iter foradraws

6:declareb▷Shell of length iter forbdraws

7:declaremu▷Shell of length iter formudraws

8:a←b←mu←3▷Set arbitrary initial value

9:

10:fori=2:iter do

11:a[i]~p(a|a=a[i-1],b=b[i-1],μ=mu[i-1])

12:b[i]~p(b|a=a[i],b=b[i-1],μ=mu[i-1])

13:mu[i]~p(μ|a=a[i],b=b[i],μ=mu[i-1])

图1 模型变量权重的后验分布箱型图Fig.1 Box plot of posterior distribution of model variable weights

14:

15:returna[burnin:iter],b[burnin:iter],mu[burnin:iter]

2.3 评价指标结果

通过模拟结果可以发现,其中一些变量权重的后验分布(posterior)发生了较为显著变化,变量2、5、10和12在模型运行过程中表现不同(见图1)。图1给出了箱形图,总结了不同时间中模型变量权重的差异的后验分布。

表2给出了两个不同时间段模型变量权重的后验均值,以及权重差异(第1个时期~第2个时期)。表2同时给出了权重差异为0的尾部区域概率,即后验概率

π0=min{f(ω1,l-ω2,l>0|y),f(ω1,l-ω2,l<0|y)}

(9)

当数值0处于后验分布的中心位置,则上述π0值接近0.5,这表明两个不同时间段之间的权重没有明显的差异。当π0值低于某个数值(例如0.2)时,则在两个不同时间段之间模型变量的权重存在差异。对变量2、5和14的权重,π0值都低于0.2,特别是对权重14,π0值约为0.03。

表2 两个模型权重后验概率均值的差异Tab.2 Differences in the mean values of the posterior probabilities of the weights of the two models

注:最后一列为差异为0的概率。

用相同的迭代次数以及初始样本,对模型2进行了MCMC算法模拟。通过结果对比分析发现,两个模型的统计量的后验概率均值均为0.65。这表明处理这个问题不需要使用相对更复杂的模型(考虑不同的时间段),而使用简单的模型(联合模型)即可。

表3给出了在使用联合模型后对模型变量权重的后验概率的分析结果。变量4、6、10、11、14的权重均具有高于5%的后验概率均值。

表3 联合模型中的权重的后验概率分析结果Tab.3 Summary of the posterior probability of the weights in the joint model

从表3可以看出,学生对变量6给出了更高的权重(后验均值为0.139 6),其次是变量14(后验均值为0.128 7)。此外,隐变量(latent variable),即除这15个变量外还有其他方面的权重具有约为3%的后验均值,这说明在进行评估过程中,学生给隐变量的权重约为3%。

属性4是指课程内容和专业要求相匹配。属性6是指考核内容与方法和课程内容与教学的匹配性。属性10是指教师讲课的感染力和吸引力。属性11是教师的专业知识丰富程度。属性14是指对当前专业及发展趋势的了解与扩展。因此,可见学生们始终高度重视与学术质量相关的核心问题:教师的专业背景,教学质量,课程与专业的关联程度。

3 结 语

由于每个评估都应该是连续一致的过程,笔者提出了一个贝叶斯层次模型,其相对于联合分析方法具有如下优势:1) 数据输入简单,即问卷收集后就可带入到模型中,不用对数据进行处理。由于贝叶斯模型不同于传统的统计模型,所以贝叶斯模型对输出结果的解释非常直观,简单自然。2) 贝叶斯模型对所要研究的问题可以包含人们已有的认知与看法,即先验信息。3) 贝叶斯模型适应性很强,可以实时采用新的数据对模型参数进行更换,而其他传统的统计模型则需要在加入新数据后对模型参数进行重新全盘模拟。

上面所描述的特征表明贝叶斯模型具有很好的灵活性、包容性和适应性,其突破了统计中联合分析的局限,可以被扩展并应用于其他相关的研究中,除了能持续性地评估和检测服务质量外,贝叶斯模型还可以监测学生偏好与各种社会经济时间序列的关联性,将研究向更深更广的领域推进。

猜你喜欢
后验贝叶斯百分比
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
反舰导弹辐射源行为分析中的贝叶斯方法*
三种常用周跳探测与修复方法的性能分析
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
基于互信息的贝叶斯网络结构学习
趋势攻略之趋势线:百分比线
后验概率支持向量机模型在目标分类中的应用
环保车型最多的美国城市