独立样本t检验在学生学业质量评价中的应用

2016-09-06 08:46杨建芹

大连教育学院学报 2016年2期

关键词：平均分方差显著性

杨建芹

（大连教育学院学习质量监测中心，辽宁大连 116021）

独立样本t检验在学生学业质量评价中的应用

杨建芹*

（大连教育学院学习质量监测中心，辽宁大连 116021）

文章介绍了差异性比较的一种科学的检验方法以及具体的应用案例。

独立样本t检验；学业质量评价；差异性比较

考试测验作为教育教学评价的一种手段，已经被广泛地应用于学校的日常教学评价与大规模人才选拔考试中。在考试成绩统计与分析中，平均分是衡量一个学校或班级教学的主要考核指标，但目前平均分差异性的比较还存在一些问题。一些从事成绩分析与管理的教师在作成绩对比分析时，通常简单地根据各学科考试分数的高低评价教师的教学业绩，不做统计检验就得出结论，这种评价是不科学的。在学业质量评价过程中，两个平均分的差异是“显著”还是“不显著”，只有进行科学地统计检验，才能客观地分析两个均值间的差异。

一、两个不同群体考生考试平均分比较的原理和方法

对学校两个不同班级的考试平均分进行比较，可以采用独立样本t检验进行统计分析。比较两个独立样本的平均分，就是确定两个样本平均分差异是由抽样误差引起的，还是两个总体平均分的确存在差异。

在假设检验中使用独立样本t检验之前，有三个前提假设必须满足：一是每个样本的观察值必须是独立的；二是样本来自的两个总体必须是正态分布的；三是样本来自的两个总体必须有相同的方差。［1］一般情况下，对于大样本（通常指样本容量大于或等于30）而言，前两个前提基本都能满足。当有理由怀疑总体不是正态时，作为补偿，应当选用相对较大的样本。第三个前提又叫方差的同质性，这个前提非常重要，因为违背这个前提，不能对独立测量实验数据进行任何有意义的解释。

二、独立样本t检验应用实例

为了验证两个考生群体的平均分差异是不是显著，可以利用两个独立样本t检验进行统计推断，如果满足独立样本t检验的三个前提假设，接下来可分五步进行。第一步，建立零假设和非零假设；第二步，确定意义水平α（考试数据分析解释中，一般选择α=0.05，少数情况下选择0.01）；第三步，计算检验统计量的值；第四步，对于自由度为df的t统计检验量，利用计算机获得概率p值；第五步：判断结果。如果用统计软件SPSS，这一比较过程会更加便捷。下面通过例1来说明，根据SPSS的输出结果如何判定独立样本t检验的第三个前提假设是否满足，以及对独立样本t检验结果的解读。通过例2进一步说明独立样本t检验在学生成绩差异性比较中应用的必要性。

1.班级学业成绩差异性比较

例1：在一次高三模拟考试中，某学校的高三四班（66人）和七班（67人）理科数学的平均成绩分别为101.34分和95.52分，有些人认为两个班级平均成绩相差5.82分，差异显著，这样的评价是否科学？

分析：由于四班和七班的数学成绩可看成是两个独立的样本，且测试成绩可近似认为服从正态分布，由此可知，前两个前提条件都是满足的，利用SPSS进行分析可得到独立样本t检验结果，如表1所示。

在Levene's Test for Equality of Variances（Levene方差齐性检验）和Equal variances assumed（假设方差相等）下显著性水平Sig=0.08＞0.05，表示两个样本的方差是齐性的，这表明独立样本t检验应用的第三个前提条件也是满足的。因为方差是齐性的，由表1的第一行可得，显著性水平Sig=0.101＞0.05表明检验不显著，即该学校高三年级四班和七班的成绩没有显著差异。两班的平均成绩差异可能是由偶然的随机因素造成的。我们通常认为的成绩相差五六分就差异显著是不科学的。因为影响学生成绩的因素较多，不能简单地比较考试成绩平均分的高低，还需要判断两个班平均成绩的差异是由偶然的随机因素造成的，还是由平时的课堂教学效果造成的，亦或是教师的教学质量引起的。

表1　独立样本t检验结果表

2.学校学业成绩差异性比较

例2：对大连市某个区的四所学校某次物理考试成绩进行差异显著性检验，独立样本t检验分组统计表和结果表汇总在表2中。

表2　不同学校物理考试成绩基本统计量和t检验相关结果

由表2第一组数据可知，编码为18和19的两所学校平均分相差1.754分。由独立样本t检验结果可知，校正t=1.763，校正自由度（df）=644.054，显著性水平Sig=0.078＞0.05，表明检验结果不显著，两所学校的中考物理成绩没有显著差异。而由第二组数据可知，编码为93和68的两所学校平均分相差1.743分。校正t=2.345，校正自由度（df）=476.094，显著性水平Sig=0.019＜0.05，第二组的两所学校的中考物理成绩有显著差异。由表2的数据可以看出，第一组的两所学校和第二组的两所学校同样是平均分相差两分，但第一组的两所学校中考物理成绩并没有显著性差异，而第二组的两所学校中考物理成绩却有显著性差异，第一组的两所学校的成绩差异可能是由偶然的随机因素造成的，而第二组的两所学校的成绩差异可能受到诸如成绩分布状况的影响，单单比较两个数值的大小是没有意义的。

由以上的两个例子可以看出，在评价学生的学业质量状况时，尽管平均分是一个非常重要的指标，而且比较起来也很直观，但直接比较并不科学，我们应该借助于科学的统计方法，综合考虑影响成绩的诸多因素，来客观地分析两个平均分之间的差异。而不能仅凭感觉来对不同学校，不同班级的学生成绩进行简单排名。

［1］刘红云.应用心理统计学［M］.北京：北京师范大学出版社，2015：172-173.

［责任编辑：知然］

On Application of Independent Sample T Test in Quality Evaluation of Students'Academic Achievements

YANG Jian-qin
（Study Quality Monitoring Center，Dalian Education University，Dalian，116021，China）

This paper introduces a scientific test method for difference comparison and provides specific application cases.

independent sample t test；quality evaluation of academic achievements；difference comparison

G424.74

1008-388X（2016）02-0052-02

2016-01-18

杨建芹（1981-），女，山东临沂人，小学高级教师。