基于K-近邻技术的教学效果评测方法

2015-09-26 02:01白宁
现代计算机 2015年17期
关键词:评测数据挖掘标签

白宁

(山西警官高等专科学校计算机科学与技术系,太原 030021)

基于K-近邻技术的教学效果评测方法

白宁

(山西警官高等专科学校计算机科学与技术系,太原030021)

0 引言

教师教学效果评价又称教学质量评价,是教学评测中的一个重要组成部分。对教师教学效果进行科学、公正、客观的综合评测,是一种可以有效地促进教学质量提高、了解教学情况的科学有效的且符合教育规律的方法之一[1]。然而,在实际教学效果评测任务中,需要计算、存储和挖掘大规模复杂数据,因此需要大量人力、物力和财力[2]。将数据挖掘技术[3]应用于教学效果评测,有望得到比传统人工评测方法更为合理的结果。

针对传统教学效果评测方法效率低下的问题[4~6],本文提出一种基于K-近邻技术的教学效果评测方法,通过对评测数据进行筛选、综合,给出一个相对比较客观的教学效果评测结果,以反映该教师的教学水平。

1 数据挖掘及K-近邻技术

数据挖掘[7]又称为数据库中的知识发现,是目前人工智能和数据库以及机器学习等领域研究的热点问题,其通过自动化地分析数据库中的数据并进行推理,以从大量数据中挖掘出未知但有用的信息,帮助企业中的领导者及时修改方案,从而做出一个正确的、低风险的决定,最终给企业带来最大的收益。

K-近邻分类方法[8~11]是近年来提出的一个较为成熟的数据挖掘方法,已被广泛应用于实际各种领域,以解决实际生活的各类分类问题。其主要思想是根据每个待测样本与已知标签样本的相似性,选择相似性最高的k个样本,统计其标签分属的类别数目,选择数目最多的类别作为该待测样本的标签。通过K-近邻技术进行教学效果的评测,不仅有效衡量了教师的教学水平,而且同时参考了已有的评测标准,有望提高教师评测的效率和准确性。

2 基于K-近邻的教学效果评测方法

针对传统人工统计方法对于教师教学效果评价效率低导致不能有效衡量教学效果的问题,本文提出了一种基于K-近邻技术的教学效果评测模型。

本文结合K-近邻方法简单、易于实现的优势,设计了基于K-近邻的教学效果评测方法。具体地,基于K-近邻的教学效果评测方法如下:

(1)对于每个教师,采集50条有效的关于课堂评测、学生成绩、学生评测部分的数据集,每个教师的课堂评测部分数据集一致,其他两部分评测数据集不同,并将各特征值标准化,构成一个50行22维(每个教师22个评测特征值,具体介绍见实验部分)的教学效果评测数据集其中

(2)根据学校往年的情况选择部分关于“优秀”、“良好”、“正常”、“不合格”的评测标准,构成t个正确的有标签样本,即,其中txj的特征构成与前面教学效果评测的数据xi的特征构成一致,tyj∈{“优秀”,“良好”,“正常”,“不合格”}。

(3)计算实际得到的评测数据xi与每个设定的有标签样本txj的相似度S(txi,txj),计算方法为:

(4)按相似度从大到小进行相似度排序,得到一个新的标准样本集序列,其符合如下规则:

(5)选择相似度最高的前k个标准样本,统计标签样本中分属于“优秀”、“良好”、“正常”与“不合格”的标签样本个数,并将个数最多的标签作为该待测样本的标签,即:

(6)对其他所有待测样本循环执行(3)~(5)的操作,直到所有样本标签得到为止,取值最多的评测结果作为该教师最终的评测结果,算法结束。

3 模拟实验

本文对某学校已经存档的学生评测的教师数据的平均值作为实验中的有标签标准数据集,以其中100名教师作为测试集进行测试,以增加实验的可信程度。本文采集了课堂评测数据、学生课程成绩数据和学生对教师的评价数据,避免了传统单一评测标准带来较大评测误差的弊端。对于课堂评测部分数据,主要包含以下9个方面:教师完成教学目标的情况、教材处理的合理性、教学程序的规范性、教学方法和教学手段是否恰当、教师教学基本功、学法指导情况、学生能力培养和素质提高、和谐的师生关系、教学效果是否明显;对于学生成绩部分的数据,主要包含了学生考试的卷面成绩、学生的出勤成绩、学生的作业成绩3个特征;对于学生对教师的评测,本文采用包含10个具体指标的调查问卷的形式得到,涉及到了教师教学过程的所有核心环节。

实验中,每个教师的评测数据由50条评测记录构成,即每个教师进行50次评测实验,取得到的结果中最多的值作为该教师评测结果,并统计了测试的正确率,计算方法如下:

具体实验结果见表1(其中+n代表其他类错分到本类n个样本,-n代表本类错分到其他类n个样本)。

表1 实验评测结果

从实验结果可以看出,本文提出的基于K-近邻的教学效果评测方法在多数指标上都得到了较好的测准率,而且比传统人工测试的方法提高了效率,不需要进行反复的测试。当然,对于样本数目较少的类别,如本例中的不合格类,由于样本数目过少,且所属的特征区域较大且分散,因此当待测样本与该类标准样本差异较大时,采用K-近邻方法无法识别。

4 结语

本文针对传统教学效果评测方法效率低下、测准率低、需要反复测试统计的问题,提出一种基于K-近邻技术的智能化教学效果评测方法,结合已有的标准评测数据,以给出一个相对比较客观的教学效果评测结果,不仅可以反映教师的实际教学水平,而且可以纵向比较教师师资的变化情况。在后续的工作中,将结合噪声处理的方法,有效解决基于K-近邻分类方法的教学效果评测中无法有效处理噪声样本的问题。

[1]袁凌,谢赤,谢发胜.高等学校教师教学效果评价的问题及其对策研究[J].大学教育科学,2006(1):42~44

[2]Koliteh E,Dean A V.Student Ratings of Instruction in the USA:Hidden Assumption and Missing Conceptions about Good's Teaching [J].Studies in Higher Education,1999,1(24):27~16

[3]苗夺谦,王国胤,刘清等.粒计算:过去、现在与展望[M].科学出版社,2007

[4]马希荣,孙华志.数据挖掘技术在教学评测中的应用[J].计算机工程与应用,2003,39(19):51~54

[5]周玉敏.基于Rough集的数据挖掘在教学评测中的应用[J].重庆邮电大学学报(自然科学版),2008,20(5):627~630

[6]袁燕.基于数据挖掘的教学评测系统研究[D].华中科技大学,2006

[7]钟晓,马少平,张钹等.数据挖掘综述[J].模式识别与人工智能,2001,14(1):48~55

[8]Mitchell H B,Schaefer P A.A"soft"K-Nearest Neighbor Voting Scheme[J].International Journal of Intelligent Systems,2001,16,459~468

[9]Liu Z G,Pan Q,Dezert J.A New Belief-Based K-Nearest Neighbor Classification Method[J].Pattern Recognition,2013,48(3):834~844

[10]Hu Q H,Zhu P F,Yang Y B,et al.Large-Margin Nearest Neighbor Classifiers Via Sample Weight Learning[J].Neurocomputing,2011,74(4):656~660

[11]Nicolas G P,Domingo O B.Boosting K-nearest Neighbor Classifier by Means of Input Space Projection[J].Expert Systems with Applications,2009,36(7):10570~10582

Teaching Effect Evaluation;Data Mining;K-Nearest Neighbor

Teaching Effect Evaluation Method Based on K-Nearest Neighbor Technology

BAI Ning
(Department of Computer Science and Technology,Shanxi Police Academy,Taiyuan 030021)

1007-1423(2015)17-0045-03

10.3969/j.issn.1007-1423.2015.17.010

白宁(1975-),男,汉,山西晋城人,硕士,讲师,研究方向为智能信息处理、计算机软件等

2015-05-15

2015-05-28

针对现在教学效果评测问题中数据量大、评测标准繁多、不能有效衡量教学效果的问题,结合数据挖掘领域最典型的K-近邻方法,提出一种基于K-近邻技术的教学效果评测方法,以对教学效果的数据进行综合挖掘和评测,提高教学效果评测的准确性。

教学效果评测;数据挖掘;K-近邻

To solve problems that the large data,evaluation standard redundancy and the teaching effect can be not measured effectively,presents a teaching effect evaluation method based on K-nearest neighbor technology combining with the K-nearest neighbor of data mining area. By this method,the accuracy of teaching effect evaluation can be improved.

猜你喜欢
评测数据挖掘标签
次时代主机微软XSX全方位评测(下)
次时代主机微软XSX全方位评测(上)
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
攻坡新利器,TOKEN VENTOUS评测
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
Canyon Ultimate CF SLX 8.0 DI2评测
一种基于Hadoop的大数据挖掘云服务及应用
让衣柜摆脱“杂乱无章”的标签