基于SPSS 与AMOS 的问卷信度效度检验
——以数学焦虑、数学态度和数学效能的关系研究为例

2020-12-21 03:16胡典顺朱展霖

教育测量与评价 2020年11期

胡典顺朱展霖

一、问题提出

由华东师范大学教育学部、北京师范大学教育学部、全国教育科学规划办和光明日报社教育研究中心联合主办的“全国首届实证教育研究论坛”，于2015 年10 月17 日—18 日在上海华东师范大学举行。论坛提倡：破解研究范式的陈旧，从传统的思辨性研究转向基于数据、证据的实证研究，形成新的实证教育研究文化。近年来，实证研究愈来愈受到教育研究者的重视，因为这是提升教育科学研究水平并且与国际教育研究接轨的必由之路。[1]遗憾的是，在当前的教育研究中，仅凭经验、感觉和主观想象，随意地而不是科学地、规范地对数据进行统计分析的现象仍然大量存在。研究者要想在教育研究中做到“有理有据”“言必有据”，研究过程与结论让人真正心服口服，就必须采用科学的研究手段和正确的研究方法。在实证研究中，问卷调查和试题测试等方式是十分常见的。研究者在使用调查问卷和测试卷时，必须先进行相应的信度与效度分析。信度和效度良好是任何被应用的测量工具必须具备的前提条件，信度和效度分析也是研究者进行量化研究时必须养成的良好习惯。然而，在实际研究过程中，有人要么不知道要做，要么不知要做些什么。

随着我国教育体制和模式改革的不断推进，学生在数学学习中的情感态度形成、价值观建立及心理健康发展越来越受到教育研究者的重视。《普通高中数学课程标准（2017 年版）》强调，教学应遵循学生身心发展规律，贴近学生的思想、生活实际并充分符合学生的成长需要，从而促使其主动地发展数学核心素养。[2]数学焦虑、数学态度、数学效能是反映学生数学学习状态、学业表现、心理发展趋势等方面的重要指标，探究并厘清三者关系对于落实学生数学核心素养发展具有重要价值。在以往研究中，已有一些因素不完全相同而模式相似的研究，但这些研究大多缺乏系统地运用统计软件对测评问卷或量表的信度和效度进行分析。[3][4][5][6][7][8][9]本文采用SPSS 26.0和AMOS 22.0 等统计分析工具，对一个包含数学焦虑、数学态度和数学效能3 个维度的调查问卷的信度和效度检验过程进行介绍。

二、研究方法

本研究采用的调查问卷来自笔者负责的“湖北省初中生数学素养测评”项目，该问卷参考了PISA 2012 和TIMSS 2003 的学生问卷并在此基础上修改而成。项目团队对PISA 和TIMSS 学生问卷进行了十多次讨论，然后在湖北省武汉市的3 所学校进行测试并不断修改和完善，形成最后的调查问卷。基于本文目的，笔者选择了问卷中的3 个维度，即数学焦虑、数学态度和数学效能，对湖北省16 个市州的27，769 名初中生进行调查。问卷中的3 个维度分别对应第3 题（3-1，3-2，3-3）、第6 题（6-1，6-2，6-3）和第8 题（8-1，8-2，8-3，8-4，8-5，8-6）。每个项目均使用5 点计分法，1 表示“很不同意”，2 表示“比较不同意”，3表示“中立”，4 表示“比较同意”，5 表示“很同意”；或者1 表示“很没信心”，2 表示“不太有信心”，3 表示“中立”，4 表示“比较有信心”，5 表示“很有信心”等。

三、信度检验

问卷或量表的质量检测指标包括信度（reliability）和效度（validity）等。信度是问卷或量表测量结果的可靠性，可靠性越高的问卷或量表，越不受时间、地点等的影响，用其进行检测得到的结果也较为稳定。效度指问卷或量表的准确性，衡量问卷或量表能否把要测量的目标真正地检测出来。信度是效度的必要条件，而非充分条件。一个问卷或量表如果没有信度，就没有效度；有信度，未必有效度；没有效度，信度再高也没用。

打开SPSS 26.0 中的相关文件，把数学焦虑、数学态度和数学效能3 个维度共12 个项目的调查数据，通过“分析→刻度→可靠性分析”，模型选择“Cronbach’s α”（其他信度指标如折半信度等本文不进行介绍）等步骤，可得到表1 和表2的结果输出。

表1 中，由于Cronbach’s α 系数=0.753＞0.7，说明整体量表的可靠性较好。表2 中“删除项后的标度平均值”表示删除该题项变量后，分量表其余题项加总的新平均数。“删除项后的标度方差”表示删除该题项变量后，分量表其余题项加总后的新方差。“修正后的项与总计相关性”表示该题项与其余题项总分的积差相关系数，此系数值越高，表示该题项与其余题项的内部一致性越高，反之，内部一致性越低。“删除项后的Cronbach’sα”表示的是该题项删除后，其余题项变量构成的分量表的内部一致性系数改变情形。

通过同样操作步骤，可以分别得到表3 中3个维度的Cronbach’s α 系数0.889，0.901，0.907。有些研究中，信度分析可能到此为止了，其实我们还可以进一步做组合信度（composite reliability，CR）的分析，对问卷信度进行进一步检验。组合信度表示潜在变量结构内部一致性，值越高表示内部一致性越高，0.7 为可接受门槛，建议值为0.6 以上。组合信度的计算要根据AMOS模型中的标准化因素负荷量来进行计算。潜在变量的组合信度是模型内在质量的判别准则之一，若潜在变量的组合信度值在0.6 以上，则模型的内在质量理想。[10]表3 呈现了本研究3 个维度的组合信度结果。

表1 信度分析结果

表2 项总计统计量

表3 各维度信度及组合信度

四、效度检验

因子分析有两种：一种是利用数据探索测量变量框架的探索性因子分析（exploratory factor analysis，EFA），即测量变量的理论架构是因子分析后的产物；另一种是利用数据评估理论观点或概念架构的计量模型是否合适的验证性因子分析（confirmatoryfactor analysis，CFA）。SPSS 软件只能进行探索性因子分析，验证性因子分析可以借助AMOS 软件进行。

1.探索性因子分析

与信度检验一样，打开SPSS 26.0 中的相关文件，把数学焦虑、数学态度与数学效能3 个维度共12 个题项的调查数据，通过“分析→降维→因子”步骤，可得到KMO 检验和Bartlett球形检验结果。

表4 KMO 检验和Bartlett 球形检验

KMO 值愈大，表明变量间的共同因素越多，变量间的净相关系数越低，越适合进行因子分析。[11]表4 表明，Bartlett 球形检验中，p=0.000＜0.05，符合球形检验标准。结合KMO 值和Bartlett 球形检验值两项指标可知，本例适合进行因子分析，可以继续解释其输出结果。

通过因子分析，表5 显示前3 个主成分的累计方差贡献率达到75.757%，因此前3 个主成分能够解释数学焦虑、数学态度和数学效能，这是一个比较理想的结果。

表6 中，旋转后的成分矩阵结果显示，12 个题项在结构上刚好分成3 类，并且正好符合我们预先设置的数学效能、数学态度和数学焦虑3 个维度。

表5 总方差解释

表6 旋转后的成分矩阵

2.验证性因子分析

探索性因子分析探讨的是问卷或量表的结构效度，验证性因子分析则要检验此结构效度的适切性与真实性。[10]限于篇幅，本研究不对AMOS软件的操作步骤进行介绍，只解释其输出结果。我们先分别建立数学焦虑、数学态度和数学效能的测量模型，其目的是筛选题项，通过分析发现模型的各参数指标都达到要求，再建立测量模型（图1）并输出其标准化结果。

关于模型输出的结果，通过模型拟合数据与参考范围对比（表7），我们发现，除了CMIN/DF和p 值，其他数据均满足要求。在结构方程模型中，当样本容量较大时（本文样本容量是27，769），模型卡方值也会变大，此时p 值会变得很小，容易形成拒绝虚无结论。因而若是样本数较大，在整体模型适配的判别方面，应再参考其他适配统计量，而不应只以卡方值判断。[10]综合本研究数据，笔者认为，模型可以接受。

基于验证性因子分析的效度检验还需要计算平均方差抽取量（average variance extracted，AVE）和组合信度，它们的计算均要利用标准化估计计算模型中的标准化因素负荷量。平均方差抽取量和组合信度的计算公式如下：

图1 测量模型

公式（1）和公式（2）中，λ 为标准化因素负荷量，n 为该因子的测量指标个数。AVE 计算的是可测变量对潜在变量的解释能力，AVE 越高表示解释能力越强，理想值为0.50以上，0.36 为最低可接受值。

表7 模型拟合指标

表8 标准化回归系数

通过观察表8 中的标准化因素负荷量estimate（或标准化估计值），研究者可以比较问卷各维度的相对影响力。[12]以表8 中的0.730 和0.890为例，其计算过程如下：

依照上述过程，研究者可以分别计算出其他维度的平均方差抽取量和组合信度。

通过上述信度与效度检验，研究者可以建立结构方程模型，并根据结构方程模型输出的标准化结果完成相关数据的呈现，这是解释结构方程模型必需的。由于本文的主要目的是介绍问卷的信度和效度检验，对于结构方程模型的结果我们不再做进一步呈现和解释，有兴趣的读者可以自行探索或阅读相关书籍。

五、结语

实证研究者要想做好信度和效度检验，一方面需要熟练掌握相关的统计分析工具。在大数据时代，不会进行数据分析，不能熟练掌握SPSS、AMOS 之类的统计分析工具，对于教育实证研究来说，要转变研究范式、体现研究的科学性与规范性，简直就是一句空谈、一种奢望。另一方面，实证研究者要重视研究设计，要认真思考研究目的是什么、问卷（测试卷）如何设计、后期数据如何分析、利用怎样的工具进行分析等问题。此外，研究设计需要依据相关理论而不是想当然，否则后期的数据分析要么无法进行，要么即使能分析，若数据与模型不能拟合，也无法实现研究目标。

基于SPSS 与AMOS 的问卷信度效度检验——以数学焦虑、数学态度和数学效能的关系研究为例