基于课程关联度的电子信息类核心课程甄别

2019-04-17 12:58钱玲王海青谷亚林
教育教学论坛 2019年15期
关键词:核心课程关联度大数据

钱玲 王海青 谷亚林

摘要:电子信息类各专业核心课程甄别的目的,是为了激发教师的质量意识与竞争意识,实现并明确促进学生学习的教学目标与教学方向。文章利用教务管理信息系统大数据,应用统计学关联算法,分析以往毕业学生各课程成绩与GPA的数据,甄别出电子信息类专业的“核心”课程,为学校的教学活动发挥了导向、诊断和监督等功能。文中所研究的方法同样可以推广到其他高校和其他专业、从而为促进人才培养提供理论依据和数据支撑。

关键词:大数据;核心课程;GPA;关联度

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2019)15-0079-03

高校各专业核心课程是高校专业课程体系建设的核心,承担着专业人才培养的基础性任务,反映专业特点、体现专业特色、支撑专业发展,其辐射而出的其他专业课程与之共同构成了完整的专业课程体系,进而形成了专业人才培养体系。学分绩点—GPA(grade point average)是大学生专业素质的一个重要体现,分析教学大数据中课程成绩与GPA的关联度可以发现隐藏在数据之间的相互关系,甄别出对GPA影响较大的核心课程,有助于进一步做好专业课程建设工作,促进高校的内涵提升和质量提高。

国内外高校通过教学大数据对课程体系、教学模式、数据分析都做了许多研究。加利福尼亚大学洛杉矶分校的Kharkar教授[1]等通过分析数学系核心课程关联度,为教授这些课程的教师提供教学指导;清华大学[2]利用教务管理系统的构建了统计分析工具系统,该系统验证了数据分析工具对于教务管理者的决策支持价值,体现了嵌入教学系统的数据分析工具的优势;浙江大学[3]通过对资产的归纳、整理,最终形成权威、全面的资产数据,并提供数据查询和分析服务;复旦大学[4]“教育管理信息化平台”和“教育资源公共服务平台”建设的过程中,也积累了丰富的信息化实践经验;电子科技大学[5]构建了教育大数据一体化平台,此平台提供了精准预测学生成绩,助力学生精准资助等个性化、精准化的管理服务。

本文通过对南京某重点高校的电子信息工程专业,已经毕业的4届学生所有课程成绩,以及所有学生最终的GPA数据进行关联度分析,计算出各课程对GPA成绩影响的不同程度,从而甄别出该专业的核心课程,以期为促进高校学生的成长和发展提供数据依据和参考。

一、数据与整理

在大数据时代,通过数据挖掘技术可以获取事件之间的关联性,为正确的决策提供技术保障。一般核心课程在高等教育来讲通常指基础课程中的必修课,我们这里的“核心”课程是指和学生整个大学期间的GPA关联度最高的几门课程。

1.数据的来源。南京某重点高校的电子信息工程专业是江苏省品牌专业,该校的教务系统已经保存了以往学生的完整的成绩数据,每个专业所有学生的课程成绩数据都保存为Excel文件,我们收集刚刚毕业的前4届学生(即2015届—2018届)的学习成绩数据文件,这些原始数据包括:该专业每位学生的每门课程的每次考试成绩,有些学生的一门课成绩不止一个,例如,正常考试成绩、补考成绩、重修成绩等,平均每位学生的成绩数据有100条左右(每位学生大概修了70多门课程,部分课程还不止一个成绩),并且每条数据又有23个属性(每门课程属性数据如表1所示),粗略估算4届学生的课程成绩数据接近一百万条。

2.数据的整理。从学校教务处获取的学生各门课程成绩,均采用百分制记分,该专业4届毕业学生共有674名,在校4年内必须修满172学分,除了必修课程以外,学生之间选修课程存在差异,按照一门课平均2.5学分计算,每个学生平均选修70门课程。另外部分学生原始成绩数据还存在正常考试、补考以及重修等不同类别的成绩,为了使结果更具有真实性,我们设定几个成绩中,只取第一次有效成绩(正常考试的用正常考试成绩,没有正常考试成绩的用第一次缓考或补考成绩)作为我们的计算数据。每门课程成绩的原来属性有23个,例如:{学号,姓名,开课学期,课程编号,课程名称,学分,成绩,考试性质,…},而有些属性需要,有些属性不需要,通过整理将课程属性精简为:{课程编号,开课学期,课程名称,课程属性,学时,学分,开课单位}共7个属性,经过整理的数据用来计算课程关联度。

二、关联分析

关联系数是用以反映变量之间关系密切程度的统计指标。关联系数是按积差方法计算,以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。spearman秩相关系数是统计学的三大相关系数之一,是一个非参数性质(与分布无关)的秩统计参数,由Spearman在1904年提出,用来度量两个变量之间联系的强弱,比较适合对GPA影响较大的核心课程的甄别。

2.算法流程。根据Spearman秩相关系数的计算公式,以及经过整理的4届学生课程考试成绩的数据,用Python语言作为编程语言,所设计的算法模块如图1所示。(1)首先读取原始数据的4个Excel文件,将其合并成一个csv格式的文件;(2)删去课程不需要的属性,保留特定属性,并对同一个学生同一门课的多个成绩进行去重,仅保留第一次有效成绩,由于存在选修课程的差异,保留有效成绩超过学生总数50%的课程数据,删除选修课程较少的课程数据,完成数据的整理;(3)计算每个学生每门课程百分制成绩对应的业绩点和每个学生的GPA;(4)将所有学生的GPA进行排序,将每个学生的有效课程的业绩点进行排序;(5)根据Spearman秩相关系数的计算公式计算各门课程的Spearman值,从而甄别出核心课程。

通过数据挖掘和统计学关联度计算,为我们获得电子信息类专业的核心课程甄别,提供了数据支撑。

3.关联系数。通過4届毕业学生共有674名的课程成绩的原始数据,利用上述分析与计算,共计算出54门课程(包括实践课程)的Spearman系数,下面列出Spearman系数最高的10门课程。

从表2可见,10门核心课程共有39学分,占总学分的22.4%,都是必修课程。其中,工程数学、概率与过程、大学物理(Ⅰ)和大学物理(Ⅱ)是学科教育课,余下6门课程都是专业基础课程;这9门课程都是在学生大一和大二必修的课程(只有数字信号处理课程除外,其授课时间在大三上),所以,加强大一和大二学生的学习方法教育就非常必要。

三、意义分析

依据往届学生教学大数据中核心课程与GPA的相关数据,就可以分析现在在校学生的核心课程成绩,尤其是大一和大二的在读学生,可以对学生的未来学习趋势进行科学预测,为学生的自我学习监控与指导、为教师的教学决策提供更精细化的服务。这样克服以往经验式的,缺少足够的数据分析判断、佐证教学行为效果的缺点,实现以数据驱动的“因材施教”。上述课程关联度分析对当前教学方面的意义体现在以下三个方面。

1.管理系统。高校教学管理部门,通过分析大一和大二学生核心课程的成绩,可以及时调整学生的培养方案。基于这些信息,学校不仅可以预测出每个学生在其他课程的得分,也可以预测出每个学生在其他课程的挂科可能性;分析核心课程的掌握程度,将学生分为不同类型,例如:“学术型”“能力型”和“潜力型”,根据“分类指导、分层施教和个别培养相结合”的原则,对不同类型学生分别实行“深度拓展型、能力强化型、扬长教育型”教育策略,引导学生个性化发展,使每一位学生都成为更好的自己。

2.教学系统。传统的教学系统往往存在片面、主观、模糊化的倾向。现在每个教师在上课前,可以通过计算学生的前面核心课程成绩,明确自己授课的学生学习状况,事前知道优秀学生和问题学生的群体,可以进行准对性教学。对符合学困生发展趋势的问题学生进行预警和指导,加强管理和检查;对有异于常人的优秀学生进行个性化培养方案,有针对性地制订培养计划和教学方案,推送个性化的学习资料,推荐个性化的实践锻炼平台,指导个性化的职业规划;对普通学生进行鼓励教育,使学生从被动学习变为自我教育、自主学习,激发其学习的活力。

3.学习系统。直观地说,学生成绩和他们的重要知识掌握情况有密切关系。分析学生对核心课程的掌握程度,每个学生就可以自己预测未来学业趋势。大一和大二学生在每学期都可以评估自己核心课程的成绩、自己的能力和兴趣,调整学习方法和努力方向,预测自己后续课程学习的难度,从而提前规划自己的时间和精力。

四、总结

随着全球信息化的高速发展,电子信息类专业成为近几十年来发展最快的学科之一。学生要学的理论课程越来越多,间接导致学生发展不均衡,如何在诸多课程中,抓住主要矛盾成为我们研究的重点,通过核心课程的甄别,可以为高校教与学提供数据支撑,实现了从定性分析到定量分析的转变,促进教学管理科学化、精细化。通过在校学生核心课程的成绩就可以预测毕业时的GPA情况,可以及时认识教学问题,尽快解决存在问题。上述通过教学大数据甄别学科专业核心课程的方法,同样可以应用到其他专业和其他高校,具有一定的推广应用价值。

参考文献:

[1]R Kharkar, J Tran and C Z Marshak.Core Course Analysis for Undergraduate Students in Mathematics[J].arXiv:1605.00328v1[math.HO] 2 May,2016.

[2]邓文俊,等.基于教务管理系统的数据分析工具的研究与设计[J].中国电化教育,2014,(5):138-143.

[3]方伟杰,等.浙江大学:数据共享提高公共资产利用率[J].中国教育网络,2012,(6):60-61.

[4]陈翼,等.复旦大学:信息化支撑教学与人才培养模式创新[J].中国教育网络,2014,(10):45-48.

[5]呂红胤,等.电子科技大学一体化大数据提供师生精准画像[J].中国教育网络,2017,(2):78-81.

猜你喜欢
核心课程关联度大数据
基于灰色关联度的水质评价分析
基于灰关联度的锂电池组SOH评价方法研究
基于灰色关联度的公交线网模糊评价
广义区间灰数关联度模型