基于SAS的高校学生成绩抽样及统计推断——以东华理工大学期末试卷抽样为例

2015-12-18 12:27闫霏霏

东华理工大学学报(社会科学版) 2015年3期

朱琳，闫霏霏

(1．东华理工大学理学院，江西南昌330013;2．中国地质大学(武汉)数学与物理学院，湖北武汉430074;3．华中科技大学数学与统计学院，湖北武汉430074)

在高校的教学过程中，经常要对成绩、试卷或者其它材料进行检查分析，以便于对前一阶段的教学状况进行评价及改进。由于高校学生人数较多、范围较广，而时间、经费和精力有限，往往不能对全部情况进行普查，只能进行抽查。而目前抽样时，大部分高校使用的抽样方法还是抽签法，这种方法在被调查对象众多的情况下，其费时、费力的弱点便非常明显。本文通过高校中常需要抽样的实际情况，结合抽样调查理论，介绍了两种抽样方法并运用SAS软件(SAS 9．1．3版)进行抽样和推断。SAS的抽样功能比较强大，但现在市场上的SAS教材中介绍如何抽样和推断的不多，因此在文章中针对东华理工大学(以下简称学校)的两门公共数学课程的试卷抽样及成绩推断给出了具体的实现过程。

1 高校常见的抽样情况及抽样方法

1．1 简单随机抽样

在学校的课程设置中，概率论与数理统计属于公共数学类课程，修课学生人数较多，但是期末试卷采取统一命题的形式，批改和成绩登录也都由大学数学教学部统一完成，批改后的试卷也集中保存。因此对试卷的抽样调查不需要分批、分部门进行，在对试卷情况和成绩的调查时可用简单随机抽样法［1］进行抽样。

从有N个单元的总体(Y1，Y2，…，YN)中抽取n个单元(y1，y2，…，yn)作为样本，一切可能的CnN种实现均有相同的概率出现。这时采用的无放回的等概率抽样方式就是简单随机抽样。

在对2014年上半年学校南昌校区概率论与数理统计期末试卷进行抽样调查时，有效考试(除了缺考、缓考等情况)的人数为1 844人，将这些学生名单作为总体(数据文件为gl201302)进行抽样。按照往常抽样的习惯，抽取总人数的10%，也就是185人，将抽的样本保存在临时逻辑库work下文件sample 中，用 SAS 的过程步 proc surveyselect［2－5］可以实现，程序如下。

其中，proc surveyselect后的选项data指定被抽样数据是临时逻辑库下的gl201302;method表明了所用的抽样方法是简单随机取样(srs);rate表明抽样比例为0．1(可用n=185代替);out表明样本文件名，这里样本数据存放在临时逻辑库下，文件名为Sample;seed=1234表明这次随机抽样的种子数是1234。

运行程序后，被抽取的185位学生的名单信息保存在临时逻辑库下的数据文件sample中，试卷调查时，只需对该文件中的学生试卷进行调查。

1．2 分层抽样

与概率论与数理统计不同的是，学校高等数学的教学是针对不同的教学计划而分批次进行的，且不同批次的试卷的制定和批改均是分开的。考虑到不同批次之间的差异，在抽样的时候需要用分层抽样法［1］进行抽样。

分层抽样是将大的总体分成若干小的总体，每一小总体成为一个层，在每层中抽取一个样本，将各层的样本合在一起组成原总体的一个分层样本。有两类情况适合进行分层抽样，一是各小的总体之间有明显的差异，每层内的各单元差异较小，层与层之间的差异较大;二是由于组织管理的方便，必须进行分层。

对2014年上半年学校南昌校区高等数学Ⅱ期末试卷进行抽样时，有效考试人数为3 288人，将这些学生名单作为总体(数据文件为gs201302)进行抽样。仍然抽取总人数的10%，也就是329人，将抽取的样本保存到临时逻辑库，文件名为sample2。由于高等数学Ⅱ的教学是分5批进行的，每批的人数不同，在分层(批)抽样之前先统计每批的人数及每批的抽样数。

每位同学的所属批次记录在变量_COL2中，可以用proc freq过程步进行统计。

统计出的每批的总人数列在表1中。

表1 高等数学Ⅱ每批学生总人数

抽取每批的10%时，抽取样本数分别为138，76，36，53，26。

在进行分层抽样之前，先对数据gs201302按照分层变量_COL2进行排序，这里用proc sort过程进行排序。再用SAS的过程步proc surveyselect进行分层抽样。

用proc surveyselect进行分层抽样时，method=srs表明每层内仍然用简单随机抽样进行抽样;n后面列举出每层要抽的样本数;其它的选项含义与前面相同。Strata后指明分层变量是_COL2。

抽取的329位学生的名单信息保存在临时逻辑库下的数据文件sample2中，同样地，试卷调查时，也只需这部分学生的试卷情况和成绩进行调查。

2 对总体情况的推断

在对抽得的两门课程的样本试卷进行调查后，往往希望通过样本试卷的成绩来对总体成绩进行估计，通常需要估计的是总体的平均成绩、优秀率和不及格率。

2．1 总体平均值的估计

(1)简单随机样本下的对总体的估计。在抽取简单随机样本后可以用简单估值法可得到样本平均值，它是总体平均值的无偏估计中S2是总体方差。的一个无偏估计是，其中s2是样本方差。

对抽到的文件sample中的185位同学的成绩进行调查后，将每位同学的成绩保存至该文件，成绩变量名为_COL8。对该成绩进行分析，估计出总体平均值也即是南昌校区该年级学生概率论与数理统计的平均成绩及其95%的置信区间。用过程步 proc surveymeans［2］进行实现，程序如下:

这里，proc surveymeans后的选项data功能同上;total指定总体的人数1844;语句var后面列出要分析的变量名_COL8，也即是学生成绩。

程序运行后在结果窗口中可以看到对总体平均成绩、其均方偏差和95%置信区间的估计，见表2(数据保留三位小数，下同)。

表2 概率论与数理统计平均成绩的估计结果

从输出结果可知，这次抽样的样本量是185，平均成绩¯y=66．403，平均成绩的均方偏差v(¯y)=1．555，总体平均分的 95% 置信区间是［63．335，69．471］也即是

这里需要注意的是在对sample2的数据进行分析时，层与层之间的抽样比差别不大，因此校正前后的结果差别不大。如果是在每层的抽样比差别比较大的情况下时，加权是必要的。

从分析结果可知，这次抽样的样本量是329，均的值，这里α=0．05。而事实上，由大学数学教学部统计出来的该学期南昌校区概率论与数理统计总体平均分是67．643，可以看出包含在此置信区间内。

(2)分层样本下的对总体的估计。如果分层抽样样本是从每一层独立抽取的，每一层内抽取的是简单随机样本，且每层的总体平均值¯Y用简单估值时，则估计量是的无偏估计。对应的均方偏差为，而它的一个无偏估计为

对样本sample2中的329位同学的高等数学Ⅱ试卷成绩进行调查统计后，要估计出总体平均成值及其95%的置信区间。与不分层的情况不同的是，在用过程步proc surveymeans进行样本分析之前，要先给出每批考试的总人数。

将每批考试的总人数读入一个数据集groups。

程序运行后在结果窗口中可以看到对总体成绩、其均方偏差和95%置信区间的估计(见表3)。

表3 高等数学Ⅱ平均成绩的估计结果

在抽样的时候，由于抽样个数是整数，取整时造成实际上各层之间单元抽样的概率并不相同。为了对结果进行校正，可以将每层的抽样概率的倒数作为权重对考试成绩进行加权。而用proc surveyselect进行分层抽样时各个样本单元的抽样比及其倒数(samplingweight)已经包含在样本数据中，所以在proc surveymeans过程中可以将该变量作为权重进行计算，也即是在上面的语句中再加上weight samplingweight语句，可得到校正后的结果(见表4)。值，均值的均方偏差v(¯y)=1．201，总体均值的95%置信区间是［59．648，64．373］。而事实上，大学数学教学部统计出来的该学期本科生高等数学Ⅱ成绩均值为62．834，在此置信区间内，且与估计值绝对误差仅有0．824。

表4 高等数学Ⅱ平均成绩校正后的估计结果

2．2 比例估计

在对成绩进行调查时，往往还希望了解该课程的考试优秀率(成绩大于或等于90分)或不及格率(成绩低于60分)。以调查不及格率为例，如果将不及格称为特征，而我们要调查的这一特征的比例，其实就是符合该特征的个体的个数占总单元数的比例。令

则z=z1+z2+…+zn即为样本中具有该特征的个体总数n1，而平均数是该样本中具有该特征的单元的比例p，是总体中具有该特征的比例P的一个无偏估计。因此我们只需要将样本中具有该特征的个体标记出来，然后用前面介绍的proc surveymeans过程对总体进行推断即可。

要了解概率论与数理统计中考试不及格的学生占的比例，需要先生成一个数据集，将含有该课程成绩的样本中不及格的标注出来，不妨取该变量名为 fail。

再用推断概率论与数理统计平均成绩的方法进行分析即可，只需将分析的数据集换成sample3，分析的变量换成fail。

在输出窗口看到的结果如表5所示。

表5 概率论与数理统计考试不及格率的推断结果

从结果中可以知道，推断总体中不及格比例为0．227，而该比例的 95% 置信区间为［0．169，0．285］。

而对于高等数学Ⅱ成绩不及格的比例的推断过程与之类似，只需要将proc surveymeans的分析方法换成2．2节中对分层样本的分析即可。

3 结束语

SAS的surveyselect过程能实现的抽样的方法较多，除了简单随机抽样(srs)，可重复的简单随机抽样(urs)还有系统抽样(sys)、序列抽样(seq)、pps抽样(pps)等抽样方法［3］。在本文中介绍的两种抽样方法使用比较普遍，除了对试卷的抽样，比如还有对大四毕业生的就业实习和毕业论文的抽查，由于这些材料由各个学院组织完成，因此材料抽查要在各学院分别进行，这时要用分层抽样法进行抽样。但如果抽样时只抽取学院，且要以该学院的规模大小作为权重时，使用pps抽样比较恰当。抽样时具体选用哪种抽样方法进行抽样要视应用时的实际情况而定。

另外需要注意的是，在每次对同一个总体进行抽样的时候，如果种子数没有指定，或者每次随机抽取的时候给定的种子数不同，可能得到的抽样结果不同。在对总体情况进行推断时，在允许的条件下尽量多抽几次样本，对每次抽得样本的分析结果取平均值来作为总体的估计值。

［1］孙山泽．抽样调查［M］．北京:北京大学出版社，2012:1-203．

［2］党辉，郭家钢．SAS统计软件的SURVEYSELECT过程在血吸虫病流行病学抽样调查中的应用［J］．热带病与寄生虫学．2006，4(2):67-70．

［3］谭志军，徐勇勇，等．应用SAS和SPSS进行复杂抽样［J］．中国卫生统计，2012，29(1):145-146．

［4］汪海波，等．SAS统计分析与应用——从入门到精通［M］．北京:人民邮电出版社，2011:411-438．

［5］王睿，贺佳．随机抽样方法的SAS实现［J］．中国卫生统计，2007，24(1):85，93．