粗糙集在员工考评系统中的应用

2015-04-30 13:15仝虎张刚
软件导刊 2015年4期
关键词:约简粗糙集

仝虎 张刚

摘要摘要:粗糙集是一种处理不精确、不一致、不完整数据,并从中发现隐藏的知识规则,揭示其潜在规律的数学方法。将粗糙集理论引入到企业员工考评系统中,对企业员工各项考核指标进行分析评价并约简,去除冗余指标,提取出关键考核指标,再进一步分析去除冗余指标后的数据,从中发现规律并提取出本质的考核规则。

关键词关键词:粗糙集;约简;考评系统

DOIDOI:10.11907/rjdk.1431062

中图分类号:TP301

文献标识码:A文章编号文章编号:16727800(2015)004005502

0引言

每年年终,企事业单位都会对内部员工进行年终考评,通过评价员工的工作热情、任务完成情况、对公司所作贡献、工作努力程度、工作能力、出勤情况等,为员工一年来的工作打分,以此作为评优依据和年终奖分级发放依据。在诸多考评指标中,有些指标并不重要,而有些指标却很关键。如何挑选出关键考评指标同时归纳提取出重要的评价规则,以此作为衡量员工工作考评依据尤为重要。本文将粗糙集理论和方法引入到员工考评系统中,利用它对考评系统中各项考核指标进行分析并约简,去除冗余指标,然后进一步分析去除冗余指标后的数据,从中发现本质的考核规则。

1粗糙集理论简介

粗糙集(Rough Set)理论自1982年创建以来就一直备受研究者关注。目前,该理论在医疗病例研究、商业策划、银行预算、气象预测等领域已有广泛应用。粗糙集的具体理论可参见文献[1]-文献[3],粗糙集理论解决问题的步骤以及各步骤中用到的算法如下:

(1)数据预处理。数据预处理是将决策表中的数据补齐和离散化,处理成规范、一致、完备的数据。决策表数据补齐的方法[3]有直接删除包含空缺数据记录、将空缺值作为特殊值处理、采用一定算法对空缺值赋值等。决策表离散化的算法[3]有等距离划分法、等频率划分法、根据一定的方法结合属性值具体取值进行断点选取方法等。

(2)求核属性并进行属性约简。核属性是粗糙集理论的一个十分重要的概念,它对于属性约简问题具有重要意义。目前主要的求核算法[46]有分辨矩阵法、差异表法、逐列消除法等。属性约简是在保证决策表决策属性与条件属性之间依赖关系不变的前提下删除冗余属性,对决策表进行简化。目前属性约简算法[3,78]主要有一般约简算法、MIBARK算法、归纳式属性约简算法、基于特征选择的属性约简算法等。

(3)值约简并提取规则。值约简是在属性约简的基础上对决策表作进一步处理,得到更加简化的决策表,值约简的过程其实就是提取规则发现规律的过程。目前值约简算法[3,89]主要有数据分析法、归纳值算法、基于决策矩阵的值约简算法、启发式值约简算法等。

2基于粗糙集的员工考核指标分析

现有某企业的员工考核样表(见表1),将该表作为一个决策系统,由表可知,条件属性C={学历,出勤率,工作效率,任务完成情况,工龄},决策属性D={考评结果}。

为了简化该表,采用粗糙集理论和方法对该表进行处理,具体步骤如下:

(1)预处理。由于表1数据是一致和完备的,只需进行离散化:学历={2:博士,1:研究生,0:本科};出勤率={2:>95%,1:85%~95%,0:<85% };工作效率={2:高,1:中等,0:低};任务完成情况={2:超额完成,1:完成,0:基本完成};工龄={2:≥5年,1:2~5年,0:≤2年};考评结果={2:优秀,1:合格,0:不合格}。离散化后的考评结果如表2所示。

(2)求核属性并约简属性。采用文中提到的逐列消除法求得表2的核属性是{出勤率},然后利用改进的基于分辨矩阵和逻辑运算的属性约简算法对表2进行属性约简,删除冗余属性后得到属性集{出勤率,工作完成情况},如表3所示。(3)值约简并提取规则。采用启发式值约简算法对表3进行值约简,得到表4。

将表4中的重复记录删除,得到最终的员工考评系统决策规则表(见表5)。利用Rough Set约简方法,从表1中11条原始数据中提取出4条决策规则:①IF工作完成情况=超额完成,THEN考评结果=优秀;②IF出勤率<85%,THEN考评结果=不合格; ③IF(工作完成情况=完成),THEN考评结果=合格;④IF(出勤率>95%)且(工作完成情况=基本完成),THEN考评结果=合格。

3结语

实现有效的员工考评对企事业单位意义重大。本文利用粗糙集理论和方法分析了考评系统指标与考评规则。实践证明,该理论能够对员工考评系统进行有效约简,既可以减少考评指标,又可以简化考评规则,简化后的考评系统与原考评体系的考评结果相同。

参考文献参考文献:

[1]PAWLAK Z.Rough set[J].International Journal of Computer and Information Science,1982,11(5): 341356.

[2]PAWLAK Z.Rough set: theoretical aspects of reasoning about data[M].Dordrecht: Kluwer Academic Publishers,1991.

[3]王国胤. Rough集理论与知识获取[M].西安:西安交通大学出版社, 2001.

[4]HU X H.Learning in relational databases:a rough set approach[J].Computational Intelligence,1995,11(2): 323337.

[5]黎东英,王应明.基于粗集理论的决策系统简化方法[J].计算机测量与控制,2005(7): 707709.

[6]赵军,王国胤,吴中福,等.一种高效的属性核计算方法[J].小型微型计算机系统,2003(1):19501953.

[7]王珏. Rough Set约简与数据浓缩[J].高技术通讯,1997(11):4045.

[8]常犁云,王国胤,吴渝.一种基于Rough Set理论的属性约简及规则提取方法[J].软件学报,1999(11):12061211.

[9]ZIARKO W,CERCONE N,HU X.Rule discovery from databases with decision matrices[C].9th Int. Symposium on Foundation of Intelligent System,1996:653662.

责任编辑(责任编辑:孙娟)

猜你喜欢
约简粗糙集
基于二进制链表的粗糙集属性约简
基于粗糙集的不完备信息系统增量式属性约简
优势直觉模糊粗糙集决策方法及其应用
实值多变量维数约简:综述
基于模糊贴近度的属性约简
基于键树的粗糙集属性约简算法
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
两个域上的覆盖变精度粗糙集模型
一种改进的分布约简与最大分布约简求法