基于回归树模型的教师评价分析
——以福建师范大学福清分校为例

2015-02-13 01:25徐鲁雄谢超凡
关键词:福建师范大学福清学年

徐鲁雄,谢超凡,徐 琳

(福建师范大学 福清分校,福建 福清 350300)

基于回归树模型的教师评价分析
——以福建师范大学福清分校为例

徐鲁雄,谢超凡,徐 琳

(福建师范大学 福清分校,福建 福清 350300)

现在许多高校都实行了数字化校园,教师评价系统都依靠软件系统,学生通过客户端—服务器模式(B/S)提交相应的评价指标分数,这种评价方式是否客观,是否受到学生本身的成绩影响,是否与学生所在的院系、专业、年级等离散因素相关.为此,文章建立基于回归树的模型来对教师评分系统进行分析,得到学生自身的成绩、专业、年级、等字段与教师评分之间的相关关系.

评价系统;回归树; 相关分析

教师的教学是高校建设中最为基本也是最为重要的一个环节,是教师专业化的最基本要求.目前,国内研究主要集中在教师的评价指标体系的构建以及对教师评分的计算汇总方法[1-3].通过文献趋势分析、理论支撑以及实证调查,构建出教师的评价指标体系、教师的评分表以及专家权重评价表,通过层次分析模型进行归化,最后通过数据的统计与分析得出教师的评分结果.对于学生本身的成绩与教师评分之间的相关关系尚无研究,因为在学生本身的成绩与教师评分之间存在主观因素,也就是学生如果觉得自己考试成绩好或者对教师的评分结果抱着无所谓的态度,不管评价指标体系如何构建,不管评分结果如何汇总,得到的结果肯定都与实际相差甚大,因此需要对教师的评分与学生自身的成绩进行相关分析,在此基础上还可以进一步考察学生所在的院系、专业、年级、等字段与教师评分之间的相关关系.基于此,本文以福建师范大学福清分校为例,基于决策回归树模型的教师评分分析.

1 回归树简介

在20世纪70年代后期和80年代初期,机器学习研究者J.ROSS Quinlan开发了决策树算法,称作ID3(Iterative Dichotomiser,迭代的二分器)[4].这项工作扩展了E.B.Hunt, J.Marin和P.T.Stone的概念学习系统.Quinlan后来提出了C4.5(ID3的后继),成为新的监督学习算法的性能比较基准[5],但是这两种算法主要处理离散属性之间的分类关系.1984年几位统计学家(L. Breiman,J.Friedman,R.Olshen和C.Stone)出版了分类与回归树(CART)[6],CART可以处理连续属性之间的相关关系,从统计上给出了属于某个类别的概率.ID3,C4.5,CART都采用贪心(即非回溯的)方法,其中决策树以自顶向下递归的分治方法构造.大多数树决策树归纳算法都沿用这种自顶向下方法,从训练元组集合它们的相关联的类标号开始构造决策树.随着树的构建,训练集递归地划分成较小的子集.

如今,Microsoft研究出来的Microsoft决策树算法是一种混合的决策树算法,它支持分类和回归两种任务.Microsoft决策树算法的一个独特性是它可以依据不同类别的多属性进行关联分析,本文就是采用这种决策回归树进行分析.

2 建立模型

2.1数据准备和导入(ETL)

服务器上存放的事各个学年学期的评价明细数据,因此,必须首先对数据进行按学号进行指标汇总,使用如下的sql代码,并且只要修改相应的学年学期即可得到其他数据.

Select b.xy, b.zymc, b.dqszj, a.*

From (Select b.xh, b.xm, b.kcmc, b.cj, a.xn, a.xq, a.xkkh, a.pjcj, a.jszgh,

a.jsxm

From (Select a.xn, a.xq, a.xkkh, a.jszgh, d.xm jsxm, a.xh,

Sum(b.qz * c.dyf) pjcj

From xspfb_200920101 a

Left join pjzbxxb_200920101 b on a.pjh = b.pjh

Left join pfdzb_200920101 c on a.dj = c.pf

Left join jsxxb d on a.jszgh = d.zgh

Group by a.xn, a.xq, a.xkkh, a.jszgh, d.xm, a.xh) a

Left join cjb b on a.xkkh = b.xkkh

and a.xh = b.xh) a

Left join xsjbxxb b on a.xh = b.xh

整理好数据,通过sql server 2008的DTS导入本地的数据库中,得到最终的汇总数据,数据事例总量为3003161.

2.2创建挖掘结构和模型

使用Microsoft Business Intelligence 建立挖掘结构和模型.

CREATE MINING STRUCTURE Teacherevaluate_structure

(ID LONG KEY,

CJ DOUBLE CONTINUOUS,

DQSZJ TEXT DISCRETE,

XN TEXT DISCRETE,

XQ TEXT DISCRETE,

ZYMC TEXT DISCRETE,

PJCJ DOUBLE CONTINUOUS

)

ALTER MINING STRUCTURE Teacherevaluate_structure ADD MINING MODEL Teacherevaluate

( ID

CJ REGRESSOR

DQSZJ

XN

XQ

ZYMC

PJCJ PREDICT

)USING Microsoft_Decision_Trees

模型建立好后,使用如下语句训练和处理模型.

INSERT INTO Teacherevaluate_structure

(ID ,CJ,DQSZJ,XN,XQ, ZYMC,PJCJ)

OPENQUERY(Teacherevaluate, ’Select ID ,CJ,DQSZJ,XN,XQ, ZYMC,PJCJ From

Teacherevaluate’)

2.3模型分析

由模型得出的散点图如图1.

从整体的回归直线来看,模型的准确率达到0.92,具有相当高的准确率,回归方程如下:

PJCJ= 88.641+0.059*(CJ-77.661)

(1)

根据回归系数与相关系数之间关系,其中σCJ,σPCCJ为学生成绩和老师评价分数标准差.

(2)

由此可知学生的成绩与对教师的评价成绩之间存在弱正相关.从这个数据中我们可以知道回归趋势,学生的成绩越高,教师的评价分数也越高.其次,学生不会因为成绩太差或者太高就给老师的分数就越低或越高,也就是给的还是客观成绩.

由于这只是总体上的回归,我们必须进入决策树的每一层查看回归的具体情况,但是由于回归树比较巨大,本文选取其中的一部分进行分析,并不影响整体的结论,当进入下一层学年层次时候,如图3所示,由挖掘图决策者可以观察每个学年的学生成绩与教师评价分数的回归关系,从而可以看出哪个学年的教学成果相关性比较强,例如在2010-2011年的子回归树中查看相应的数据,得到该学年的回归方程:

PJCJ= 88.894+0.105*(CJ-77.236)

从回归方程可以看到相关系数为0.105,是比较强的弱正相关,但是平均分却比其他学年来得低些,由此可以知道学生的成绩受教学效果影响比较大.

从回归树的学年层次可以进一步站看进入所在专业的细化层次,查看每个学年每个专业的回归系数,从而横向比较每个专业的学生成绩与教师评价分数的回归关系,回归树一级一级地展开到最后可以得到每个属性下的具体回归树.

不管进入哪个层次,由挖掘图例可以看出每个节点给教师给出的回归系数都是比较接近的,可以说给出的是客观的教师评价,并不会因为自己考差或者考高而给教师评分带来噪声,并且学生的成绩越高教师的评分成绩越高占的比例相对更大.

3 结论

本文利用回归树模型建立对教师评分系统的评价分析,得出了一些有意义并且有指导意义的结论,学生成绩与对教师评分之间存在弱正相关.学生的成绩越高,教师的评价分数也越高,学生并不会因为成绩太差或者太高就给老师的分数就越低或越高,也就是给的是客观成绩.并且可以依据此模型对高校教师教学进行评价管理,通过展开回归树的不同层次,可以查看各个学年、学期、专业、年级的教学效果,但不管在哪个层次哪个属性,对教师的评价效果都是客观的,符合教师本身的教学水平,因此使用回归树模型可以对高校的教师教学进行行之有效的管理.

[1] 左文龙.研究型大学教师评价指标体系的探讨[D].电子科技大学学报,2008(4):23-28

[2] 张 丹.基于多元评价模型的高校教师教学评价系统设计与实现[D].河北科技大学学报,2011(3):35-38

[3] 张文娟.山西省高校教师绩效评价体系研究[D].太原:山西财经大学,2013

[4] QUILAN J R.Induction on decision trees[M].California:Machine learning press,1986:81-106

[5] Quinlan J R.Programs for machine learning[J].Morgan Kaufmann: SanMateo,CA,1993(2):85-95

[6] HUNT E,MARIN J,STONE P.Experiments in induction[M].New York:Academic Press,1996:107-110

Based on Regression Tree Analysis Model of Teachers’ Score Analysis——Case Study of Fuqing Branch of Fujian Normal University

XU Luxiong, XIE Chaofan, XU Lin

(Fuqing Branch, Fujian Normal University, Fuqing 350300, China)

Many colleges and universities have implemented a digital campus, and teacher evaluation relies on a software system.The students use the client-sever mode to submit the appropriate evaluation scores which we call it B/S mode. whether of the evaluate system is objective , whether is affected by the students of themselves scores and is related to students faculty、grade、subject and other factors. In this paper, we establish a regression tree analysising model to analyse teachers’ score system in order to get the correlation between students’property and teachers’ scores.

score system; regression tree; correlation analyse

2015-07-09

徐鲁雄(1958-),男,福建福清人,硕士,福建师范大学福清分校教授,主要从事模式识别研究.

1672-2027(2015)03-0033-04

TP391.6

A

猜你喜欢
福建师范大学福清学年
“华龙一号”示范工程福清核电6号机组首次临界
内容回顾 温故知新
第二届星火学年
福建师范大学连续7年支教留守儿童
关于Weitzenbock不等式的一条不等式链
台湾青年随父深耕福清台农创业园20载
福建师范大学博士生导师
——陈桂蓉教授
那些年,我们错过的旗袍秀——旗媛淑院福清分院揭牌
杨浦区老年大学举办2015
——2016学年期末汇报演出
十里闻香