综合评价赋权优良标准的研究

2016-12-09 07:51朱喜安李良

统计与决策 2016年19期

关键词：赋权一致性系数

朱喜安，李良

（中南财经政法大学统计与数学学院，武汉430074）

综合评价赋权优良标准的研究

朱喜安，李良

（中南财经政法大学统计与数学学院，武汉430074）

文章对综合评价方法的赋权方法进行了研究，并提出了6条综合评价赋权的优良标准，分别是评价对象对客观条件的适应性、分布一致性、相关度、离散程度、内在一致性以及导向作用，并运用实证对各标准进行了检验，通过综合测度值对各方法进行了排序，实证认为赋权方法的优良标准能够较为明显地区分不同的赋权方法对评价对象的优良程度，各种赋权方法的优良性从高到低排序为：BP神经网络法＞灰色关联度法＞主成分分析法＞TOPSIS法。

综合评价；赋权；优良标准

0　引言

当前学者们已经提出的综合评价方法有很多，与之对应的赋权方法也不少，但问题在于对同一个或者一类评价对象，各种赋权方法得出的结论往往不一致，或者由于各种方法的出发点不同，解决问题的思路不同，适用的对象不同，因为评价对象的多样性，就需要我们根据方法的适用性及研究对象的特点选取适合的方法进行评价，并不能一个方法而放之四海而皆准。就赋权方法的挑选问题，目前还没有一个较为客观、准确的标准进行参考，学者通常都是根据自己的主观判断进行方法的选择，较少考虑赋权方法的优良性。本文从对综合评价的赋权的方法梳理出发，综合当前学者提出的一些赋权方法的优良性标准，提出了6条赋权方法的优良标准，并通过实际案例分析对6条标准合理性进行了实证。

1　赋权方法的优良标准研究

为了体现各个评价指标在评价体系中的作用地位以及重要程度,必须对指标赋予不同的权重系数，不同的权重系数，会导致截然不同甚至相反的评价结论。因此赋权方法的优良性尤其重要，我们结合学者的赋权方法优良性标准的一些前期研究，根据各类赋权方法的特点，提出了6个赋权方法的优良评判标准。

1.1对被评价对象和客观条件的适应性

不同类别的赋权方法各有特点，也有其适用的范围，因此，没有绝对优良的赋权方法，也没有完全低劣的赋权方法，赋权方法的优良标准是相对的，是以被评价对象和客观条件为基础的相对优良标准。如主观赋权法的权重大小取决于评价专家自身的知识结构、个人喜好等因素，虽然缺乏科学性和稳定性，但能够很好地反映主观意愿，在信息收集困难和信息不能准确量化的评价中适应性较强；又如客观赋权法中，变异系数法、主成分分析法、熵值法等方法，该类方法根据样本指标本身的特点来进行赋权，具有较好的规范性，但是容易受到被评价对象数据的影响，不同的样本根据同一方法会得出的不同的权数，在实际应用汇总，当样本各指标独立性很强时，变异系数法适应性较强，而对于被评价对象指标相互之间具有复杂联系的时候，熵值法得出的权数较为理想，计算量过大时，主成分无疑是一个优良的赋权方法；同时，由不同赋权方法得出的最终综合评价的结果也必须与被评价对象具体情况相符，不能出现背道而驰的情形。因此，赋权方法的首要优良标准是对评价对象和评价的客观条件具有良好的适应性。

1.2分布一致性

分布一致性作为综合评价的优良标准，是评价结果一致性的基本要求。要解决多种评价方法是分布一致性的问题实际上就是解决两个以上独立样本之间是否具有相同分布的问题，可以借助多个独立样本检验（Test for several independent samples）方法，这类方法主要有Kruskal-Wallis H检验、中位数(Median)检验和Jonckheere-Terpstra检验，我们采用Kruskal-Wallis H检验方法来检验赋权方法的分布一致性问题。

Kruskal-WallisH检验是Mann-Whitney U检验法的扩展，是一种推广的评价值检验。其基本思路是，首先对所有的仰恩合并并按照升序排列得出每个数据的秩，然后对各组样本求平均秩。如果平均秩相差很大，则认为两组样本所属的总体有显著差异。H统计量的计算公式为：

校正公式为:

其中，Ri为第i个样本的秩和；ni为第i个样本的样本量，N-Σni；tj表示某个观测值重复的次数。该检验方法的假设为：HO:各样本代表的总体分布相同；HO:各样本代表的总体分布不完全相同。

1.3相关度

赋权方法的优良标准也可从相关性角度来衡量，许芳（2015）采用了相关系数的方法，使用相关系数的平均值，假设所研究的问题共有m种赋权方法，Rij表示第i种赋权方法与第k种赋权方法所得的结果或者排序的相关系数。令则称为第i种赋权方法与其他方法的差异程度。差异度越低，表明第i种方法相对于其他方法越有效。程琮等（2010）利用Kendall'W协同系数对不同病人戒酒指标进行分析，判断评分是否具有一致性。

Kendall'W协同系数检验(Kendall's Coefficient of ConcordanceW)是由Kendall和Babington-Smith在1939年提出，该检验旨在考察M种评价方法对N个对象的评判结果之间是否一致，它是通过讨论协同系数W这个指标显示出样本中的实际符合与最大可能的符合之间的分歧程度来进行的。该检验的思想是考察多次评价中的排序是否随机，Kendall'W协同系数反映了各行数据的相关程度，如果其取值接近于1，则认为评价中的排序不是随机的，即样本来自多个配对总体的分布存在显著差异。Kendall'W协同系数：

其中：m为评价方法的数目；n为评价对象的数目；R为各被评价对象的等级之和。该检验方法的假设为：HO: m中方法的评价等级不具有一致性；HO:m种方法的评价等级具有一致性。

1.4离散程度

本文利用Euclidean距离，修正离散度的定义，用以测度评价方法的相对有效性。设研究问题有m种赋权方法，令Dij表示第i种方法与第j种方法所得两个结果的Euclidean距离，令则称Di为第i种方法与其他方法的离散度。离散度越小，表明第i中方法相对于其他方法越有效。

1.5内在一致性

我们使用信度来测量评价结果与核心指标的相关性或者称内在一致性。信度又称测量可靠性，它是指采用同样的方法对同一对象重复测量时所取得的结果的一致性程度，表现为多次测量结果的稳定性和一致性。它根据测量的具体情况可以分为再测信度，复本信度。内在一致性信度和评分者信度。内在一致性信度（InternalConsistentReliability）是当前比较流行的信度评价方法，是分半信度的推广，反映了指标之间相关的程度，这些指标应该反映同意独立概念的不同侧面。内在一致性可以采用克隆巴赫系数来反映，克隆巴赫α系数实际上就是计算每个测试者在每个项目上的得分和总的得分之间的相关系数，并与所有单个项目得分的变异性比较。计算的逻辑是每个总分很高的测试者在每一个项目上的得分应该也很高，而每个总分很低的测试者在每一个项目上的得分应该也很低。一般认为，克隆巴赫系数在0.80以上表示测评体系的内部一致性极好，在0.6-0.8之间表示内部一致性较好，低于0.6时表示内部一致性差，应对指标进行修正。本研究信度系数在0.71-0.88，可以看出，评价指标体系具有较好的一贯性、一致性、再现性和稳定性。说明所建立的综合指标体系总体信度较高，综合评价指标体系是比较好的评价工具，测量结果可靠。根据Cronbach公式计算为克隆巴赫α系数，按照Kuder-Richardson公式计算的公式为K-R系数，后者是前者在0、1二分变量情况下的特例。克隆巴赫α系数为：

1.6导向作用

综合评价的赋权方法除了是一种事后评价外，还可以是一种事前评价，用以指导和实现评价者的意图，如近年来国家对普惠金融的发展越来越重视，为了推动普惠金融的发展，除了将普惠金融的相关指标纳入地方政府金融发展的考核评价中，还在这些指标上予以倾斜以体现考核者的重视程度，往往能够起到一定的导向作用。如导向作用不明显，在指标体系没有变动的情况下，说明赋权方法还有一定的改进空间。

2　实证分析

“普惠金融”是由联合国在推广2005年国际小额信贷管理年时提出的，它的基本含义就是：一个能有效地、全方位地位社会所有阶层和群体——尤其是贫困、低收入人口提供服务的金融体系。2016年1月国务院印发《推进普惠金融发展规划(2016-2020年)》，提出了我国首个发展普惠金融的国家级战略，李克强总理在2016年政府工作报告中亦提出要大力发展普惠金融和绿色金融。

Beck（2007）最早提出了测度普惠金融程度的八个指标；焦瑾璞（2014）总结了构建普惠金融指标体系的国际实践，其中，世界银行从需求方的角度提供有价值的信息，构建和发布了全球普惠金融指数核心指标（Global Findex Core Indicators）,评估和监测各国普惠金融实践情况，为普惠金融有关研究提供基准和标杆；曾省晖、吴霞、李伟、等（2014）对目前各国和地区以及国际组织等构建的普惠金融指标体系进行了阐述。

本文借鉴前期学者的对普惠金融的指标的研究成果，结合我国的金融具体实际情况以及数据的可得性和全面性，提出11项评价我国普惠金融状况的指标，具体如下：

表1　我国普惠金融发展水平评价指标体系

本文所使用的数据为2005年到2013年的各省数据的平均值，使用的赋权方法有主成分分析法、T0PSIS法、灰色关联度法、BP神经网络法，经过各赋权方法的计算，各省普惠金融发展状况的结果以及排名如表2，可以看到，不同方法的评价在结果上有所不同，需要对各方法的优良性进行判断和评估。

2.1.1分布一致性标准

使用Kruskal-Wallis H检验方法进行检验，通过SPSS20.0软件计算，结果如下，可以看出，根据秩均值越大，赋权方法之间差异越明显的原则，各方法的优良次序是T0PSIS＞灰色关联度法＞BP神经网络法＞主成分分析法。检验的卡方值为0.620，自由度为3，渐进显著性远大于0.05，接近于1，即表示4种赋权方法没有显著的差异。

2.1.2相关性标准

采用Kendall'W协同系数检验4中赋权方法的相关性，通过SPSS20.0软件计算，结果如下，可以根据秩均值看出，赋权方法优良性从高到低依次是：主成分＞BP神经网络＞灰色关联度。检验的卡方值为1.351，自由度为3，渐进显著性为0.717，远大于0.05，接近于1，表明我们所使用的4种赋权方法没有显著的差异。

表4　Kendall'W协同系数检验结果

2.1.3离散程度

使用欧氏距离（Euclidian Distance）计算4种赋权方法结果的近似矩阵表，该相似矩阵表实质是一个不相似矩阵，其中数值的代表不同方法的离散程度，数值越大，表示两个方法之间的距离越大，即离散程度越高。

表5　近似矩阵

从计算的近似矩阵来看，主成分分析的方法与其它三种方法的近似值较大，而T0PSIS法、灰色关联度方法以及BP神经网络方法之间的离散程度较小，从4种方法的两两近似值的均值也可以看出，主成分分析法的均值要大于其他三种方法，说明T0PSIS法、灰色关联度方法以及BP神经网络方法在离散程度这个标准而言要优于主成分分析法。

2.1.4内在一致性

采用克隆巴赫α系数来检验我们使用的4种赋权方法的内在一致性，通过SPSS20.0软件计算，结果如下，可以看出科隆巴赫α系数为0.843，表示4种赋权方法内在一致性极好。

表6　项间相关性矩阵

表7　可靠性统计量

2.1.5赋权方法优良性的综合测度

以上运用分布一致性、离散程度、相关性以及内在一致性优良标准都可以得出相应的优良赋权方法结果，但是不能全面综合反映方法的优良性，需将四个标准结合起来，对优良性进行综合测度。由于测量各指标的赋权方法不一样，导致量纲不同而且指标的方向不一致，因此应先将测量指标正向化和无量纲化。其中，分布一致性优良标准的测量指标是Kruskal-Wallis H检验秩均值，相关度优良标准测量指标是Kendall'W协同系数检验秩均值，两类指标均是秩均值越大，方法之间差异越大，属逆向指标；离散程度优良标准测量指标是两两方法近似矩阵的均值，均值越大，方法之间差异绝大，属于逆向指标；内在一致性优良标准测量指标采用两两方法项间相关性矩阵的均值，均值越大，方法之间差异越小，属于正向指标。本文采用公式（5）的方法进行指标正向化，采用公式（6）极差正规化法进行指标的无量纲化。

表8　各优良标准排名结果表

将正向化和无量纲化后的标准值相加，即得优良标准的综合测度值Y。

根据Y的值和排名，可以将各种赋权方法的优良性从高到低排序为：BP神经网络法＞灰色关联度法＞主成分分析法＞T0PSIS法。

3　结论

本文提出了对被评价对象和客观条件的适应性、分布一致性、相关度、离散程度、内在一致性、导向作用等6个综合评价赋权方法的优良标准，并通过实际案例对分布一致性、相关度、离散程度、内在一致性4个优良标准进行了实证检验，最后构造优良性综合测度对各种方法进行了优良性综合测度。

实证结果表明，对于既定的被评价对象，各种综合评价的赋权方法存在着一定的差异性，赋权方法的优良标准能够较为明显地区分不同的赋权方法对评价对象的优良程度，从优良标准的综合测度来看，优良性从高到低依次为：BP神经网络法、灰色关联度法、主成分分析法、T0PSIS法，选择相对优良的方法能够提高综合评价结果的准确性。本文也为综合评价方法的遴选提供了一个新的视角。

[1]柯雄，陈英耀，胡献之，刘文彬，谷茜，邓伟，赵列宾，董斌，施李正.公立医疗机构公益性指标赋权中的方法比较与权重优化[J].中国卫生经济，2013，（8）.

[2]阎小妍，孟虹，汤明新.综合评价中不同赋权方法的比较探讨[J].中国卫生质量管理.Vol.13No.4(SN71)，2006，（8）.

[3]俞立平，潘云涛，武夷山.科技评价中不同客观评价方法权重的比较研究[J].科技管理研究，2009，（7）.

[4]李晓倩.土地资源评价指标权重赋值方法的比较研究[D].甘肃农业大学，2012.

[5]许芳.中国区域R&D综合实力评价方法的比较[J].统计与决策，2015，（11）.

[6]王婧，张金锁.综合评价中确定权重向量的几种方法比较[J].河北工业大学学报，2001，（4）.

[7]陈琼华.综合评价中的赋权方法[J].统计与决策，2004，（4）.

[8]尚卫平.多指标综合评价方法的优选[J].南京经济学院学报，2003，（2）.

[9]郭义霞，刘朝杰，李宁秀，任晓晖.生命质量评价领域及其权重值的确定方法[J].现代预防医学，2004，（4）.

[10]李红，朱建平.综合评价方法研究进展评述[J].统计与决策,2012, (9).

[11]Martin R,MichaelB.Choosing Realistic Valuesof Indifference,Pref⁃erence and Veto Thresholds for Use With Environmental Criteria With ELECTRE[J].European Journal of Operational Research, 1998,(107).

（责任编辑/易永生）

F224.12

1002-6487（2016）19-0023-04

国家社会科学基金资助项目（13BTJ011）

朱喜安（1961—），男，湖北孝感人，教授，博士生导师，研究方向：经济统计。李良（1984—），男，湖北赤壁人，博士研究生，研究方向：经济统计。

综合评价赋权优良标准的研究

0 引言

1 赋权方法的优良标准研究

2 实证分析

3 结论

0　引言

1　赋权方法的优良标准研究

2　实证分析

3　结论