数据挖掘技术在高校学生成绩分析中的应用

2021-04-04 15:30刘金忆
信息记录材料 2021年7期
关键词:数据挖掘高校学生分析

刘金忆

(江苏经贸职业技术学院 江苏 南京 210000)

1 引言

学生的成绩至关重要,是衡量一所高校教育成果的重要标准。如今,每一所高校都十分重视学生的成绩问题,每年高等院校都会通过各种方式考核学生的学习成果,例如:举行各种竞赛、课堂回答问题、校内活动参与、举行一学期一度的期末考试,这些考核方式的结果最终会根据一定的比例换算成分数,都体现在教务系统录入的学生成绩单上。所以,现在的大多数高校虽然利用了互联网技术收集了大量的学生成绩,但当前存在的问题是对这些数据并没有很好地利用,仅仅是简单的查询和统计,无法获取成绩之间隐含的大量信息,比如学生为何取得这些成绩,开设课程之间以及学生的成绩与课程的设置之间的联系[1]。如何科学地解决学校安排与学生成绩之间、教学计划与提高成绩之间的问题,更加充分合理科学地利用学生成绩的宝贵数据资源,形成每一位学生独特的“学生画像”,为教学服务,为就业服务,为每一位学生的健康发展服务,是现在亟待解决的关键问题。

2 数据挖掘技术的作用和意义

数据挖掘技术是一项充分利用了人工智能、模糊逻辑、神经网络、机器学习及数据统计等理论知识和方法技术的数据库的核心技术。数据挖掘是从大量的、模糊的、繁杂的实际应用数据中,提取隐含在其中的、人们事先不知道的,但是极为有用的潜在信息和知识[2]。数据挖掘技术可以从繁杂的信息中提取有用的知识,实现信息之间的相互连接,有效地利用数据信息的宝贵资源。数据挖掘技术通常要经历数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估、知识表示等6个步骤[3]。数据挖掘技术的产生和发展对数据库的实际应用起到了重要的作用,这项技术可以对数据库的内容进行检索、统计、分析,对数据信息资源加以整合,用来解决实际应用中的问题。另外,数据挖掘技术还可以通过智能的分析数据信息,找出信息与信息之间的联系,从而发现一些事物在发展过程中的规律性。所以,利用数据挖掘技术可以有效分析事件发展的规律,抽丝剥茧,预测事件未来的发展方向。因此,在我国的高校教育方面,利用数据挖掘技术对高校学生的成绩进行分析和预测,从而研究和总结出学生的专业能力和学习水平、学校课程设置和学生成绩的取得之间的关系,是教学实践中的明智之举。

3 数据挖掘技术的实施方案

3.1 提出具体问题,大胆进行假设

大多数科研项目的进行都离不开提出问题、假设条件的过程。与此相同,根据数据挖掘技术建立数据库模型也离不开对提出的问题的探索,只有提出了具体的问题,模型才能根据问题给出相应的解决策略。在这一过程中,要求提出问题、进行假设时要充分了解数据挖掘技术,熟悉这一数据库研究和建设的经验和知识,同时,还要有勇气和创新力、想象力,大胆地进行假设,根据某一具体数据的数值,推断出与之相关联的信息,继而要结合实际,小心谨慎地求证这些问题,得出结论。这一过程是实施数据挖掘技术应用于高校学生成绩分析,建立相关数据库模型的基础,要求数据挖掘技术的研究者加强与相关领域的专家、学者相互沟通,充分协作。

3.2 收集数据并对数据进行预处理

一般情况下,收集数据的方法通常有“调查法”和“设计实验法”两种,“调查法”就是根据某一具体要求从特定的人群中得出的数据结果,有访问调查、邮寄调查、电话调查、网上调查等。“设计实验法”是根据研究主体的特点设置定量和相关变量,根据二者之间的关系得出大量数据,之后,研究人员还要根据数据的规律和研究,填补缺失数据。这两种方法各有其特点,在实际应用中可以灵活地选择使用。按照以上两种方法收集的数据繁多、较为杂乱,有个别异常数据的存在或者个别数值的缺失,这些都会干扰数据挖掘中的信息提取结果,因此,收集到足够的数据之后就要对这些信息进行初步的处理。对于异常数据的出现,可以在确定它的不合理性后,采用其他数据的平均值或者众数进行测算,得出相近的、合理的数值结果进行替代。若存在缺位数据,可以使用数据中的出现较多的数值或者根据平均值选择最为可能的数值来填补空缺的数值。

3.3 分析数据规律,建立模型,得出结论

一般而言,收集数据是为了得出数据之间的关联并由此推断出数据信息的发展规律,进而分析它们产生的原因和影响的因素。所以,在收集到数据并对它们进行了初步的处理以后就要仔细分析,根据研究的需要建立数据挖掘模型。在这一过程中,要求减少人为干扰因素,保持数据模型的科学性和客观性,还要确保数据挖掘模型的实用性和准确性,使普通人经过一般的学习就可以进行操作。在数据挖掘模型建设的科学性和准确性方面,要求数据模型开发者参考相关领域的资料,与相关领域的专家和学者进行合作,运用先进的建模技术,得出高精确度的、高实用性的数据挖掘技术模型。

4 数据挖掘技术应用于高校学生成绩分析中的具体措施

数据挖掘技术不断发展与进步,高校的数据库建立也越来越完善,数据资源越来越多,然而大多数高校只是把这些统计的成绩当作查询和记录的数据,这是对资源的一种浪费。如同电商领域的用户画像用于精准定位目标客户,学生画像可以将“因材施教”做到极致。及时了解学生成绩的影响因素和学校教育与学生成绩之间的关系,这些是完成学生画像绘制的重要环节。

4.1 选择数据挖掘的主要内容和研究目标

高校学生成绩由多种考察的结果构成,因此,最终影响学生成绩的因素也较多,要利用数据挖掘技术对高校学生成绩进行分析就要选择合适的挖掘内容,确立建立数据挖掘技术模型的目标。在高校学生的成绩构成中,可以选择期末考试成绩为基础数据,以研究影响学生期末考试成绩的因素为目标,据此,建立数据挖掘技术模型,进一步分析和总结规律。

4.2 构建合适的模型,进行分析

在数据挖掘技术模型中有多种算法,例如:分类分析、聚类分析、神经网络方法、决策树算法等[4]。在这里,数据模型建设者可以采用决策树算法,首先对数据进行分类,列出一组组的数据,分析每一组挖掘数据,建设出清晰的决策树。最后,对决策树的每一个分支进行更详细的分析和补充,进一步得出学生成绩的影响因素。

例如:将学生的期末考试成绩分成4个等级,不同的等级对应不同的分数段,它们分别是“优秀”,对应成绩为85分以上者;“良好”,对应成绩在75分到85分的学生;“及格”,对应成绩在60分到75分的学生;“不及格”,对应成绩在60分以下的学生。根据这些标准把学生成绩分为4组,之后再分析不同组的学生成绩的影响因素。最后,根据以上分析和研究结果得出结论。

4.3 对研究数据的挖掘和收集

分析高校学生成绩,就要充分挖掘和收集学生成绩的信息。由于目前高校对学生成绩的收集较多且极为完善,包括学生的平时课业成绩、课堂考核成绩、考试成绩,所以,构建模型的学生成绩数据可以直接从高校的成绩数据库中提取。另外,要分析影响学生成绩的因素还需要收集学生个人状况调查数据,在这一方面可以班级或小组为单位,为保证数据的真实性,要统一收集获取,在学生开班会,集体活动的课后,都可以进行收集。主要了解学生平时的生活习惯,他们对学习的兴趣、对课堂听讲的参与态度、对学校课程安排的意见等,这些都是影响学生成绩的关键因素。收集的数据可以利用表格或统计图的形式表达,进行整理和分析,最后与学生的成绩数值进行比较,从而得出结论,达到建立数据挖掘技术模型的目标。

4.4 对学生成绩和调查信息的预处理

收集过的数据和信息要进行整理和修正,在收集学生的成绩数据时进行仔细核对、确保准确无误即可,因为学生成绩在导入高校教务系统的数据库已经有专业人员进行过整理和确认。而对学生的调查信息就要进行仔细的检查和分类整理。在调查开始前就要选择合适的方式,尽可能地保证学生们反映信息的真实性。为此,数据收集要先设计科学合理的问卷调查,不可以将选项固定在一定的范围内,也不可以设置全部肯定或否定的答案,例如:问题:你对学习是否有兴趣?选项:A非常有兴趣;B比较有兴趣;C一般兴趣。这样的问题设置不能完整地反映学生对学习的全部心理,是一个失败的问题调查。

对于收集完成的信息数据要开始清理和修补,对于异常或是残缺的信息数据,无法修补,且结果影响较大的就要予以清除。对于可以修补的数据,要利用平均信息或常数进行补充[4]。

5 结语

当今是互联网的时代,大数据的开发与应用是我国发展的重要内容,各个领域的发展都离不开数据的统计与处理,数据挖掘技术已经渗透到各个行业的发展中。但在教育行业,数据挖掘技术的应用还不够广泛,高校教务系统收集着大量的学生信息,合理运用这些珍贵的资源,通过对学生画像的绘制更深刻地了解学生,是当前数据挖掘技术在教育领域应用的重点研究内容。本文结合当今时代发展,根据高校教育的实施状况、数据资源的收集和管理状况,从数据挖掘技术的实施方案方面分析,提出了数据挖掘技术应用于高校学生成绩分析中的具体措施,其中包括选择数据挖掘的主要内容和研究目标;构建合适的模型,进行分析;对研究数据的挖掘和收集;对学生成绩和调查信息的预处理4个措施。虽然当前我国数据挖掘技术在高校数据系统里应用不够完善,但经过相关领域研究者的不断努力,这种情况会得到改善。

猜你喜欢
数据挖掘高校学生分析
高校学生党支部建设及作用发挥探索
探讨人工智能与数据挖掘发展趋势
隐蔽失效适航要求符合性验证分析
高校学生意外伤害事件应对与处理
电力系统不平衡分析
基于并行计算的大数据挖掘在电网中的应用
电力系统及其自动化发展趋势分析
小议高校学生违纪处分制度
一种基于Hadoop的大数据挖掘云服务及应用
关于高校学生工作的思考