基于聚类分析的高校学生综合测评成绩评价
——以闽江学院X专业第一课堂、第二课堂学生成绩为例

2021-04-06 08:50李晓朋
山西青年 2021年5期
关键词:重合成绩单第二课堂

李晓朋

(闽江学院数学与数据科学学院,福建 福州 350108)

“第二课堂成绩单”制度既是深化高等教育体制改革、全面推进素质教育的积极探索,又是适应学生成长成才需要、契合社会对人才需求具有战略意义的制度创新。[1]从试点起,高校“第二课堂成绩单”实施已历4年多时间,为全面了解高校“第二课堂成绩单”实施总体概况,我们以闽江学院“第二课堂成绩单”大数据平台中的相关数据为数据源,借助R语言中的有关数据分析方法,以期从数据科学的角度客观地分析高校“第二课堂成绩单”制度施行概况,为构建科学合理的高校学生综合测评体系打下坚实基础。

一、聚类分析与学生大数据平台

多元分析(multivariate analysis)是多变量统计方法,是数理统计中应用广泛的一个重要分支,包含丰富的理论成果与众多的应用方法。聚类分析(cluster analysis)属于多元分析,是一类将数据所对应的研究对象进行分类的统计方法。它们的共同特点是:事先不知道类别的个数与结构;据以进行分析的数据是对象之间的相似性(similarity)或相异性(isimilarity)的数据,将这些相似(相异)性数据看成是对象之间的“距离”远近的一种度量,将距离近的对象归入一类,不同类之间的对象距离较远,这就是聚类分析方法的共同思路。[2]

Mac Queen(1967)提出了一种动态快速聚类方法——K均值聚类法(k-means cluster),其基本思想是:根据给定的参数k,先把n个对象粗略地分为k类,然后按照某种最优原则(通常表示为一个准则函数)修改不合理的分类,直到准则函数收敛为止,这样就得到了最终的分类结果。[3]K均值聚类的基本思想,K均值聚类是最简单的无指导学习方法,计算速度很快,也称为快速聚类和分层聚类不同,K均值聚类事先要根据先验经验确定需要的聚类数目。显然,k个中心(或临时中心)都是k×p矩阵。在R软件中,确定k之后,初始的临时中心可以自己输入,也可以由计算机生成。[4]

本文的研究模型是实际存在的,即闽江学院学生发展大数据平台。本文将以闽江学院2017级某专业学生的第二课堂成绩和第一课堂成绩的数据为基本数据源,主要使用聚类分析这种多元统计的方法,对“第二课堂成绩单”制度和第一课堂成绩的数据进行分析,对学生进行聚类。

二、数据分析结果

本论文以闽江学院第二课堂大数据平台数据作为数据源即样本整体,采用抽样调查的原理,选取了2017级某专业所有学生(2017年9月至2020年1月)第二课堂成绩以及该专业所有学生第一课堂成绩(大一、大二学年),样本容量为77,选取了对本文研究有效数据,接着对数据进行一定的预处理。

从样本数据分析来看,学生第二课堂成绩总体较为稳定,方差数值不大,成绩分布较为均匀,学生整体发展较为协调。但也存在个别突出的现象,如“社会实践能力”得分为0,学生参与社会实践不够积极,对社会实践的认识不够到位。因此,学校应该提前针对这类学生采取相应的应对措施,建立健全第二课堂成绩预警机制,督促学生积极参加各类社会实践。在“校园文化活动”方面,学生成绩的方差为7.338110,由此可见,在这方面存在着较为严重的两极分化现象。这表明有些学生积极参与各级各类校园文化活动,但是有些学生积极性却没有得到充分的调动,校园文化活动“二八现象”依然明显。第一课堂成绩方面,各项的最值和方差都较大,两极分化严重。

与“第二课堂成绩单”的实时动态测评不同,高校学生综合素质测评是阶段性的一年一评,期间存在着各类问题,它们会隐藏在成绩之中。作为教育工作者,仅凭大学生综合素质测评成绩难以掌握学生的实时发展状况,具有严重的滞后性;而“第二课堂成绩单”大数据平台实时进行更新反馈,及时呈现学生第二课堂的综合状况,教育工作者可以随时了解学生的情况,对于教育实施作出一定调整,努力做到有效施教、因材施教。与第二课堂成绩所反映的情况类似,两个方面的数据都可以看出,学生在文体实践方面的表现也存在着两极分化的现象。由此可知,当前的大学生综合素质测评确实存在着某些弊端,需要及时地加以调整,这也是本文为构建高校学生综合测评体系打下坚实基础的写作目的。

在R软件中,动态聚类法的K均值聚类,在R语言中的kmeans函数可以帮助完成这个聚类,其聚类后分类结果如下:

上表中数据是对学生第二课堂成绩(date1)进行分析的结果,为了更加清晰地将学生分类,即做等级化处理,我们还要对每组学生的数据做数据描述性分析,从聚类和描述性分析的结果来看,第一类的学生共有13名占总体16.67%,仅从第二课堂成绩的积分方面评估,结合该组学生的成绩的描述统计数据,其应属于优等学生,在思想政治素养模块的表现尤为突出。

表1 聚类分析结果(date1)

从聚类结果来看,第二类的学生共有7名,占总体8.97%,仅从第二课堂成绩的积分方面评估,结合该组学生的成绩的描述统计数据,其应属于表现较差的一类学生。经过观察发现他们在各个方面的表现都不及其他学生,尤其在社会实践能力方面表现较差,甚至有得分为0分的现象,应该及时对此类学生提前发出预警,督促学生严格按照学校相关要求做好社会实践活动。第三类的学生仅有1名占总体1.28%,仅从第二课堂成绩的积分方面评估,其应属于表现最优等的一类学生,在各个方面都表现较为突出。第四类的学生共有32名,占总体44.87%,仅从第二课堂成绩的积分方面评估,结合该组学生的成绩的描述统计数据其应属于中上等的一类学生。从正态分布的知识上看,这也是正好符合正态分布的。该类学生在各个方面的表现都较好,属于成绩稳定的中间阶层,这些学生是使得整体成绩稳定的基础,是从“第二课堂成绩单”制度受益的大多数。第五类的学生共有23名,占总体29.49%,结合该组学生的成绩的描述统计数据,该组学生是属于中等的一类学生,也符合正态分布的特征,与第四类学生同属于成绩中间阶级。这类学生和第四类学生有着相同的特点。

上表中数据是对学生第一学年第一课堂成绩(date2)进行分析的结果,为了更加清晰地将学生分类,即做等级化处理,我们也要对这组学生的数据做数据描述性分析。从聚类结果来看,第一类学生共有18名,占总数的23.07%。结合该组学生的成绩的描述统计数据,该类学生整体水平持中,但从数据中可以看出,他们均有不及格科目,这表明他们在对各类科目之间时间和精力分配的处理上不够合理科学,导致有些科目没有及格,这类学生需要加强对课堂知识的学习。

表2 聚类分析结果(date2)

从聚类的结果来看,第二类学生仅有1名,占总数的1.2 8%。结合该组学生的成绩的描述统计数据,该学生成绩偏下等,甚至综合测评总成绩没有超过及格线,特别是专业学习表现分比较低,而且数据显示该学生曾经有过违反校规校纪的行为。所以该类学生自成一类,是学生中的极少数,也是预警对象之一。第三类学生共有14名,占总数的17.95%。结合该组学生的成绩的描述统计数据,该类学生成绩属于中上等成绩,没有不及格科目,但是由于整体成绩不够好,所以没有获得奖学金。这反映出,此类学生需要加强对第一课堂知识的学习,在获得专业优势的前提下提升其他能力,提升综合能力,做到德智体美劳全面发展。第四类学生共有25名,占总数的32.05%。结合该组学生的成绩的描述统计数据,该类学生成绩属于中等成绩,均出现了不及格的科目,有明显的偏科现象,导致整体成绩不够好,直接的结果是没有获得奖学金。但是这类学生的数据显示他们在文体实践方面表现甚佳。所以这类学生更加需要加强对第一课堂知识的学习,掌握专业优势,同时提升其他能力,提升综合能力。第五类学生共有19名,占总数的24.36%。结合该组学生的成绩的描述统计数据,该类学生成绩属于优等成绩,没有不及格科目,整体成绩较好,均获得奖学金。各方面成绩显示,该类学生在各方面表现甚佳。

上表中数据是对学生第二学年第一课堂成绩(date3)进行分析的结果,为了更加清晰地将学生分类,即做等级化处理,我们也要对这组学生的数据做数据描述性分析。聚类分析的结果显示,第一类学生共有14名,占总数的17.95%。结合该组学生的成绩的描述统计数据,该类学生在整体学生中属于中下等水平,特点是均有不及格的科目,均未获得奖学金。数据反映,该类学生在专业学习表现方面仍有较大的进步空间,要把专业课学习作为今后的第一要务;另外品德行为表现上有待增强,要注意增强在文体实践方面的积极性,以期提升综合素质。

表3 聚类分析结果(date3)

聚类分析的结果显示,第二类学生共有28名,占总数的35.90%,是数量最多的一类。结合该组学生的成绩的描述统计数据,该类学生在整体学生中属于中等水平,该类学生的特点是均没有不及格的科目,但是因为总体的成绩不够好,因此均未获学业得奖学金。该类学生的另外一个特点就是各项成绩两极分化严重,形成木桶效应,导致即使个别方面做得很好也未能得到奖学金等荣誉。这类学生应该注意取长补短,做到优势互补,积极补短板、强弱项。第三类学生共有13名,占总数的16.67%。结合该组学生的成绩的描述统计数据,该类学生在整体学生中属于中上等水平,均没有不及格科目,但是因为总体的成绩不够好,因此均未获得奖学金。该类学生与第二类学生有相同的特点,就是各项成绩两极分化严重,产生木桶效应。这类学生应该做好自己擅长的方面后,积极弥补自己的劣势,加强弱项,才能使得德智体美劳各方面得到全面的发展。第四类学生共有2名,占总数的2.56%。结合该组学生的成绩的描述统计数据,该类学生的共同点是曾经受到过纪律处分,成绩上的差别十分的明显。第五类学生共有20名,占总数的25.64%。结合该组学生的成绩的描述统计数据,该类学生在整体学生中属于优等水平,均没有不及格科目,总体的成绩较好,均获得奖学金,各方面表现优异,是高等教育的优秀成果,也是高等教育体制机制的受益者。

三、聚类重合情况及分析

通过对聚类情况的观察,以“第二课堂成绩单”与通过传统的大学生综合测评而来的第一课堂成绩为自变量进行聚类呈现出不同的结果。

从date1和date2的数据比较来看,学号重合数为9,相应重合率为11.538%,其中第三类第四类均无学号重合出现,而在第五类中出现的学号重合数最高。从date1和date3的数据比较中,学号的重合数为22,则相应的重合率为28.20 5%,其中在第一类和第三类均无学号重合出现,而在第四类中出现的学号重合数最高。Date2和date3的数据比较中,学号重合数为27,则相应的重合率为34.615%,其中第二类无学号重合出现,而在第五类中出现的学号重合率最高。

date2和date3分别是学生在大学第一学年度和第二学年度的第一课堂成绩,是同一批学生在连续两年取得的两组第一课堂成绩,也是通过科学严谨的学生综合测评成绩计算方法计算而来,两者在时间上具有连续性,对象具有继承性。这些条件保证了两者的对象经过聚类分析后,应该具有高度的重合率,但是经过计算两者在聚类对象重合数上为27,相应的重合率为34.615%。虽然两者经过聚类分析后所得的重合率量值表现较低,但是这个数字应该被认为是这种情况下的最理想的重合效果。由此,推理date1和date2的重合数9,相应的重合率11.538%,是比较低的。从date1和date3的数据比较来看,这两组数据的重合数为22,相应的重合率为28.205%。根据分析,表现出重合率有所攀升的现象,可以被认为是合理的重合率(因为date2和date3的重合率也仅有34.615%)。主要原因是:一是闽江学院“第二课堂成绩单”制度经过一年的摸索和探究,业已趋于成熟;二是学生已经适应了这种具有创新性的育人方式;三是时间上的累计使“第二课堂成绩单”制度和大学生综合素质测评,在育人工作功能上有较高的拟合度。

猜你喜欢
重合成绩单第二课堂
“第二课堂”课程化建设路径探究
01—02合刊
500kV线路重合闸故障分析与处理
2018上半年纠“四风”成绩单
晒晒全面深改成绩单
晋江“四点钟学校” 孩子们的第二课堂
成绩单的妙用
成长课堂
糟糕的成绩单
浅析重合闸