基于WLEIS情绪智力测验的IRT分析

2015-03-19 10:00黄明明王立君
心理技术与应用 2015年3期
关键词:情绪智力

黄明明?王立君

摘 要 文章运用项目反应理论技术(IRT)对自陈式情绪智力量表WLEIS在大学生群体中的施测结果进行分析,从评分选项、题目参数以及测验整体性能与结构等方面考察WLEIS的质量。以WLEIS中文版为测验工具对大学生施测,获得数据后利用WINSTEPS软件进行分析。结果表明,WLEIS具有多维性,整个测验内部一致性系数达0.874,测验整体偏易,个别项目的评分方式也需要进行修正后方可适合对大学生进行施测。

关键词 情绪智力;情绪智力测验;IRT;Rasch模型

分类号 B841.7

情绪智力(Emotional Intelligence,EI)的概念是美国心理学家Peter Salovey和John Mayer于1990年提出的,随即引起了心理学界和管理学界的高度关注。目前为止,情绪智力的理论与实践研究成果已经非常丰硕,但是关于情绪智力的内涵与结构至今没有达成统一。围绕这个问题,学术界关于情绪智力的理论研究出现了能力模型流派与混合模型流派的争议,情绪智力测验也出现了相对应的两种取向。能力模型流派认为,情绪智力属于一种能力,通常被定义为识别、管理自己与他人情绪的能力(Goleman,1995),常见的理论模型有Bar-On的情绪智力模型、许远理的情绪智力三维结构模型等,常见情绪智力测验有MSCEIT(Mayer Salovey-Caruso Emotional Intelligence Test)、WLEIS(Wong and Law Emotional Intelligence Scale)以及WEIS(Wongs Emotional Intelligence Scale)等。混合模型流派认为,情绪智力中的自我控制、自我管理等成分与人格有交叉点,常见的情绪智力测验有ECI(Emotional Competence Inventory)和EQ-i(Emotional Quotient Inventory)等。

Goleman认为,一个人的情绪智力一般可以通过自我意识、自我管理、自我激励、移情和社交技能五大方面进行评估。Wong和Law(2002)在Goleman研究的基础上,通过对中国香港地区的实证研究发现,可以从一个人的自我情绪评估、对他人情绪评估、情绪运用以及情绪调节四个方面来衡量一个人的情绪智力,并开发了包含16个项目的测量量表,称为WLEIS(Wong & Law,2002)。此量表也是情绪智力流派中的能力模型流派代表与证明,常常被作为企业等用人单位人事测评与选拔的重要工具,对领导者情绪智力进行考察,而很少用于其他人群。为探讨此测验在大学生群体施测的有效性,本文以实证研究进行论证,采用项目反应理论(Item Response Theory,IRT)分析方法对大学生群体的施测结果进行分析,为后续的研究提供参考。

1 测验量表简介

WLEIS是Wong和Law在2002开发出来的自陈式情绪智力量表(Wong & Law,2002),该量表是在中国背景下编制而成的,对中国人施测时不存在文化差异等问题,是一个较好的本土化情绪智力量表。量表有16个项目,采用李克特5点计分,共四个维度,每个维度下各有4个项目。四个维度分别是认知自我情绪、认知他人情绪、调节情绪和运用情绪,即四种情绪智力。认知自我情绪的能力是指个体可以理解自己深层次的情绪,并将其合适地表达出来;认知他人情绪的能力即个体可以感知和理解周围其他人情绪的能力;调节情绪的能力即个体能够快速调节不良情绪,以适应当时情景;运用情绪的能力即个体能够运用自己的情绪资源进行建设性活动以提高其个人绩效的能力。这四种能力品质共同组合成了情绪智力的四维结构,此量表常被认为可以较为全面科学地测查出个体的情绪智力状态。相关实证研究(Wong & Law,2002;Wong,Law & Song,2004)已经证明了该量表具有较好的信效度,因此也被广泛采用,在管理者情绪智力的测量和研究中应用最为普遍,但在学生群体施测情况较为少见。

2 研究方法

2.1 数据来源

采取线上与线下两种施测方式相结合,以WLEIS中文版(WLEI-C)为测验工具,得分越高,表示情绪智力水平越高。对来自浙江、河南等地的大学生进行施测,所有被试都自愿匿名填写,最后回收有效问卷732份, 测验所得数据利用SPSS19.0软件和WINSTEPS3.66.0软件进行处理,被试分布基本情况如下表1所示。

表1 被试基本分布

性别 专业类别 年龄

男 女 理工 文史 艺术 16~18 18~25 25以上

228 504 409 290 33 22 572 138

2.2 项目反应理论技术

IRT是用来描述项目性质(难度、区分度、猜测度等)与被试的潜在特质对项目作答正确率影响的一种模型体系,与经典测量理论不同的是,IRT从单一项目的性质以及被试作答的正确率出发,探讨被试能力与试题性质对答对机率的影响。此外,IRT其实是许多项目反应模型的总称,可以满足各种不同计分方式与不同作答方式的测验要求。IRT对测验的分析大致可以从选项模式、项目参数特性、测量精准度等方面进行分析。

最简单最常见的IRT模型是Rasch模型,它是一种单参数Logistic模型,其最大特点就是它的项目只有难度参数,同一批项目测试被试时,应该在一个线性系统上去评定被试水平。因此,除难度参数 βi 外,其他特性都是相同的(罗照盛,2012),在测验的分析与编制过程中起着重要作用。其表达式如下列公式所示:

=

其中 θj 为被试 j 的能力, βi 是项目 i 的难度,而 Pi(θj)是被试答对某个项目的概率。在Rasch模式中,影响被试答对概率的项目特性主要是难度,因此只要了解被试的能力与项目的难度,就能知道被试在某项目上的答对的概率是多少。它对项目的特性与被试的作答反应有较严格的客观性要求,所估计出来的能力值就能反映出被试的真实能力,而且是等距量尺(晏子,2010)。

3 研究结果

通过SPSS19.0软件对所得数据进行基本分析可知,16个项目的内部一致性系数是0.874。以下是由WINSTEPS软件读入数据后整理分析出来的结果。

3.1 评分模式分析

评分模式一般指计分方式(正反向计分)、计分等级以及评分难度等。在Rasch模型中,通常是通过分析估计出每个选项的难度值以及相邻选项之间的难度差值来判定选项的合理性。

3.1.1 评分选项分布

WLEIS所得的五点计分数据由软件分析输出,评分选项共有16个不同的分布,每个项目对应一个项目,其分布曲线图可以直观地看出每个选项的难度分布并反映出特质的概率(见图1)。通过分析看出第3个项目的选项分布异常,选项2与选项1的难度差值太小,致使第二个选项起不到应有的作用,无法区分被试的能力差距,所有评分选项的难度偏小。第2个项目也出现类似的情况,但勉强可行。它们共同的缺点就是选项2与选项1的难度差距太小,不能很好地区分出被试的能力差距。第16个项目的评分选项设置较好,符合对被试能力的评定又不偏离被试群体的整体能力分布。

针对以上情况,我们则可以考虑将第14个项目的第二个选项删除,或者通过修正第3个项目的难度,使之区分开来。

3.1.2 评分选项的难度分析

在评分选项的曲线分布图中可以看出,选项的分析还是集中在对各个选项难度的分析。一个项目的选项等级所表现的难度往往会影响被试的最后作答结果。更重要的是,选项之间的难度差值体现了选项设置的质量。IRT从选项本身的难度、相邻选项之间的难度差值以及所有选项之间的难度差值判断选项设置的合理性。如下表2反映了WLEIS五点计分的IRT分析结果。

一般情况下,项目的评分选项应该符合以下5项标准:(1)每个选项上至少有10个观测值;(2)评定量表的分布应该是单维的;(3)每个类别的均值与评定量表的类别值应该是单调渐进的;(4)Outfit MNSQ小于2.0;(5)相邻的类别难度阔(step calibration),3点量表最少需要1.4个logit,4点量表要1.1个logit,5点量表要0.81个logit,至多为5个logit,当测验结果未能满足以上标准,则需要调整选项设置直至满足(Linacre,2002)。照此来说,第三个选项与第四个选项的难度差0.79欠妥,一般而言,不可轻率做出删除第三选项的决定,应该考虑通过完善测验的内容、优化自己的测验数据等工作来修正。

3.2 项目参数分析

对测验项目的参数分析大都集中在信效度、难度、区分度等。在此,我们采取IRT模型进行分析时主要考虑项目拟合度(goodness of fit)与项目难度的分析。

测验数据对模型的拟合程度表现了测验项目内容的适合程度。WEIS施测的统计结果如表3所示。

表3 部分项目拟合性能表

Enter item Measure Infit Outfit Point-measure

MNSQ ZSTD MNSQ ZSTD

3 -0.76 1.10 1.7 1.15 2.6 0.48

2 -0.86 1.03 0.5 1.06 1.0 0.51

1 -0.66 1.09 1.7 1.10 1.9 0.51

12 0.15 0.85 -2.9 0.84 -3.1 0.66

5 -0.51 1.01 0.3 0.99 -0.2 0.56

13 0.65 0.96 -0.7 0.98 -0.3 0.62

9 0.45 1.03 0.6 1.03 0.70 0.59

16 0.19 1.05 0.9 1.11 2.0 0.57

Mean 0.00 0.99 -0.1 1.01 0.1

S.D. 0.49 0.08 1.5 0.09 1.7

测验的各个项目的拟合度的标准尚未达成统一,研究者可以根据自己对测验的要求来规定Infit MNSQ和Outfit MNSQ的范围。大部分的国内外研究均选择Infit MNSQ作为评定项目对模型拟合的程度,因为Outfit MNSQ经常受到外部因素的干扰,反映的精确性不如Infit MNSQ。Infit MNSQ的范围越接近1越好,这项测验结果的Infit MNSQ值的范围在0.83至1.19之间,平均值是0.99。国内外研究认为,Infit MNSQ值的范围在0.8至1.2之间就可以认为测验结果是较好地拟合了模型,这样看来,本测验拟合度还是很好的。从难度值(Measure)来看,项目2、3、1、5难度较低,项目13难度较高,其他项目难度均在误差的范围之内。各项目的测验内容较符合被试的心理特质。

项目的Point-measure则反应了个体在某一项目上的表现与其在整个量表中表现的相关度,取值一般介于0.4和 0.8之间(Yan,2011)。一般地,中度相关是理想状态,即Point-measure值越接近于0.5~0.6越好。本测验的统计结果表现良好的相关性。

3.3 测验整体分析

测验的整体分析包括了对测验的精准性分析(是否可以精确地反映出被试的潜在特质水平)和测验的结构分析(测验维度分析)两大类工作。

3.3.1 测验精确性

对于测验精准性,我们通常采用测验信息函数(Test Information Function,TIF)和Persons-Item图。Persons-Item图更加直观地反映了被试能力分布与测验项目难度分布的一致性程度。这样一来,被试的潜在特质水平和测验项目的难度同置于一个难度尺度上,能够更加直观地看出测验项目对被试能力测查的准确性。

从图2可以看出,左侧被试的能力分布大多是以0为均值的正态分布,而右侧的测验项目分布却集中在较低难度尺度的部分,测验项目难度不能很好地与被试能力水平保持一致性。测验项目难度过于集中,而且难度较低,不利于区分出高水平被试的情绪智力水平。出现这种情况的原因有很多,最常见的就是被试作答过程中有明显的趋中效应。因此,我们可以采取反向计分和正向计分相结合的方法,也可以通过加大项目难度来改善作答集中的现象。

3.3.2 测验结构

对于测验结构分析,我们可以从测验的单维性进行分析。反映测验单维性的指标主要是首成分残差特征值的大小。一个测验通常包含几个维度,测出不同特质。Rasch模型残差的主成分分析检验量表单维性,首因子标准化残差特征值和量度解释变异数是衡量数据结构单一性的重要指标,首成分标准化残差特征值的范围应该在1.4至2.1之间(Rasch,2005)。我们分别对各个维度分开进行测查,最后勘察测验的整体结构。

由表4可知,测验的各个维度的首成分标准化残差特征值均在规定的范围内,说明了测验项目均在所属的维度之内,即每个项目只能测验大学生的一种情绪智力特质,没有特质之间的交叉现象。如果将整个测验当作一个维度,此时的首成分标准化残差特征值却是3.5,远在规定范围之外。也就是说,量表是一个多维的测验,不具有单维性。

4 讨论

从以上几个侧面的测查结果可以看出,WLEIS可以一定程度地测出大学生的情绪智力水平,但不如对管理者情绪智力的测量效果好,突出体现在测验的难度、区分度和测验评分模式方面。

在评分模式方面,除项目2和项目3的选项评定不太理想外,其他14个项目的评分模式还是很好的。而项目2和项目3反映的是被试认识自己情绪的能力,属于自我认知的范畴。大学生处于受教育阶段,对很多事物的认识还不太深刻,因此也间接地影响了其对自身的认知,这也是很多在校大学生的认知误区之一。对于选项2(较不同意)和选项3(不清楚),很多大学生界定不明;也有可能是大学生真的不太清楚自己的情绪状态,致使大多人选择中间项;抑或是被试作答时受到趋中效应的影响,没有对二者进行仔细思考,导致两个选项的难度差值达不到要求,不能区分二者之间的难度,也不能很好地界定被试的情绪智力水平。鉴于此,我们可以将表量修改为4点计分,去除选项3,这样对被试的要求就是迫选(必须界定自己的感受),可以消除以上问题。

在测验内容方面,测验从四个维度测查了被试的情绪智力水平,16个项目均在拟合的范围之内。在测验难度和区分度方面,由Persons-Item图可知,本测验的难度应该提高些,进而区分出高能力水平的被试,提高测验的精准性。另外,由测验的输出结果可以得知,本测验的项目信度指数(item reliability index)为0.99,个体信度指数(person reliability index)为0.85,它们从不同的侧面反应出了同一项目或者个体施测于相似的测验时保持自身特性的一致性,范围均在0至1之间。个体信度指数反映出被试心理特质的稳定性,常用来作为评价测验信度的重要指标。除此之外,测验的项目分割指数(item separate index)和个体分割指数(person separate index)则从侧面反应了测验的结构效度。一个测验的结构保持均衡最好,不宜过于紧凑也不宜过于松散,分割系数最低应为2.0,方可保证测验信度在0.8以上。

在测验的整体结构上,除了分割系数可以说明测验的整体结构之外,测验单维性也反应出一个测验的维度结构及其与整个测验的关系。本测验的统计结果显示出测验具有多维性,每个维度可清晰地测查其对应的情绪智力成分,且维度内的项目拟合性较好。这也论证了情绪智力四维结构理论的合理性。

5 结论与展望

总体来看,情绪智力量表(WLEIS)不宜直接用来对在校大学生进行施测,尤其是在评分模式方面,5点计分的方法不太适合大学生群体。另外,由于大学生的自我认知水平不如职场管理者,量表的第一个维度中项目难度普遍过低,且所有项目难度过于集中,不利于区分被试的能力水平。如果修正测验的难度,改5点计分为4点计分(删除容易产生趋中效应的中间选项),适当缩小两端选项的难度差距,这样的话,WLEIS就基本符合测验对象的要求了。

此外,此次分析依然存在很大的争议。首先,被试样本的选取过于单一,范围过于狭窄,这类被试群体的心理特征有较多的相似之处,很容易造成作答结果的一致性过高,致使内部一致性系数偏高(本测验高达0.876);其次,被试作答过程中存在偏差,如顺序效应等,被试作答过程中由于存在顺序效应,使得被试在作答某个维度内项目的情况趋向一致化,影响测验单维性的分析结果;最后,测验的分析方法过于单一,而实际测验过程是复杂的,可能使之与实际有不符之处。本研究的不足之处恰好为后续的研究提供了新的契机。

参考文献

罗照盛.(2012). 项目反应理论基础.北京:北京师范大学出版社.

晏子.(2010). 心理科学邻域的客观测量——Rasch模型之特点及发展趋势. 心理科学进展,18(8),1298-1305.

Goleman,D. (1995)Emotional Intelligence.New York:Bantam Books.

Linacre,J.M.(2002) . Optimizing rating scale category effectiveness. Journal of Applied Measure-ment,3(1),85-106.

Linacre,J. M.(2006)A users guide to WINSTEPS/MINISTEP:Rasch model computer programs. Chicago,IL:Winsteps.com.

Rasch,G.(2005). Critical Eigenvalue Sizes in Standardized residual Principal Components Analysis. Rasch Measurement Transactions. 19(1),1012.

Wong,C.S.,Wong,P.M.,Law,K.S.(2007). Evidence of the Practical Utility of Wongs Emotional Intelligence Scale in Hong Kong and Mainland China. Asia Pacific Journal of Management,24(1),43-60.

Wong,C.S.,Law,K.S.(2002). The Effects of Leader and Follower Emotional Intelligence on Performance and Attitude:An Exploratory Study .Leadership Quarterly,13(3),243-274.

Wong,C.S.,Law,K. S.,Song,L.J.(2004).The Construct and Criterion Validity of Emotional Intelligence and Its Potential Utility for Management Studies . Journal of Applied Psychology,89(3),483-496.

Yan,Z. (2011). Developing a Rasch Measurement Physical Fitness Scale for Hong Kong Primary School-Aged Students.Measurement in Physical Education and Exercise Science,(15),182-203.

猜你喜欢
情绪智力
农村初中生情绪智力、应对方式与心理健康?的相关研究
工作家庭冲突视角下幼儿教师情感耗竭的心理机制:情绪智力的作用
论大学生情绪智力与沟通能力的培养
情绪智力、情绪调节对锻炼投入的影响:一个中介效应模型
大学生情绪智力与人际交往效能感的相关研究
学生情绪智力对学校德育工作的启示
影响安全生产绩效的工作内嵌入因素的影响机制研究