基于聚类分析算法的伙食费类区划分研究*

2016-10-26 05:28贺德富苏喜生

计算机与数字工程 2016年9期

关键词：伙食费伙食物价

贺德富　苏喜生

(军事经济学院军需系　武汉　430035)

基于聚类分析算法的伙食费类区划分研究*

贺德富苏喜生

(军事经济学院军需系武汉430035)

伙食费类区划分是制订军人伙食费标准的重要工作。目前我军伙食费类区设置以1988年的类区划分为基础,已不能体现各地物价水平。伙食费类区优化调整实质是一个聚类分析问题,即按统一的伙食费评价标准评价各地伙食费,再运用聚类分析算法对各行政区划进行归类。研究结果表明:新的伙食费类区中6个城市应上调,2个城市应下调,3个伙食费类区间的差额应调整为2.41元、3.83元。

给养; 伙食费类区; 聚类分析; 应用

Class NumberTP393.09; E233

1　引言

伙食费是军队用于购买粮食、副食和炊事燃料的费用[1]。与伙食费相关有两个基本概念,即伙食灶别和伙食费类区。伙食灶别根据各军种、兵种人员从事不同军事任务的劳动消耗而定,各伙食灶别都规定了食物定量标准(即食物消耗类别和数质量规定);伙食费类区是指按地区物价差别划分的领报伙食费的区域[2]。部队驻地不同,市场物价不同,为了使执行相同伙食灶别的人员,吃到规定的食物定量标准,就必须以市场物价为基本标准,建立科学的伙食费类区划分理论体系,将全国划分为的若干个类区。

近年来,我军通过合并伙食灶别、归并伙食类区、调整伙食补助,基本建立了具有我军特色、符合部队实际的伙食费标准结构。但是,目前以1988年类区划分为基础、经过多次调整形成的伙食费类区[3],已不能较好地体现各地物价差异,一些地区部队对此反映比较强烈。

一是受调整周期和历史因素的影响,部分地区间存在类区与物价不协调的问题。伙食费类区的划分具有较强的稳定性,类区一经划定,一般要保持若干年。但随着各地区经济形势的发展变化,市场物价也发生了明显的变化,不及时调整,类区的合理性就会降低。从国家统计局发布的物价平均数据来看,北京市主要肉类和蔬菜类物价水平比海口市和乌鲁木齐市都要高,但是北京市被划分到二类区,海口市和乌鲁木齐市却属于三类区。因为1988年建立伙食费类区时,沿海开放城市物价普遍较高,同时要照顾边远艰苦地区,这些城市就被划到较高的类区中,后来的每次调整都采用“就高不就低”的原则,二十多年过去了,各地经济都有了很大的发展,而且发展不平衡,伙食费类区应该具有的调节地区物价差异作用得不到很好发挥,出现了伙食灶别相同的部队,在高物价地区领报到较少的伙食费,加剧了伙食费供应的矛盾。

二是伙食费类区标准差额不能很好地体现物价差距。现行伙食费标准中,同一伙食灶别分处不同类区时的伙食费差额分别是,一、二类区之间为1元,二、三类区之间为2元,三类区与实物供应类区间为5元。而从部分地区的实际物价情况来看,伙食费标准差额不足以体现不同类区之间物价实际差距。

2　聚类分析算法

聚类问题就是找出隐含在数据中的类[4],所谓类是指具有一定相似性的数据目标的集合。而相似性可以有不同的表示方法,也就是说聚类也可以有不同的表示方法,最常用的是用距离描述的相似性,称之为基于距离的聚类方法。

一个好的聚类方法能产生好的聚类,从而确保类与类之间的相似性较低,而在每一个类的内部相似性较高[5]。伙食费类区划分可以归结为按行政区划将伙食费评价值进行归类,实质上就是一个聚类分析问题。

2.1聚类分析算法的一般模型

给定空间X中有限个样本点的集合x1,x2,…,xn,记为S,聚类问题是根据样本点集合的数据相似性进行样本数据分类,因此,聚类问题分为两个主要步骤: 1) 确定类的数目; 2) 优化或调整类的模式。一般情况下,类的数目k是给定的,聚类要确定的是类的表达形式,实际上就是要确定类的中心和衡量相似性的标准[6]。

下面讨论在给定类的数目下聚类的一般优模型[10]:

给定样本点的集合S={x1,x2,…,xn}和类的数目k,确定k个类C1,C2,…,Ck满足

确定类K={C1,C2,…,Ck}的过程就是确定k个分类的中心,即确定Ci的中心zi,i=1,2,…,k。对样本集合S={x1,x2,…,xn},类Ci可以这样确定:

Ci={xj|‖xj=zi‖≤‖xj-zp‖,

p≠i,p=1,2,…,k,xj∈S}

其中‖·‖是任意的范数,即Ci是离zi最近的点的集合。目前,比较典型的聚类算法有k质心算法、k-Medians算法、CLARAN算法、BIRCH算法、DBCSCAN算法和CURE算法等[7～8]。

2.2K质心算法模型

K质心算法又称作k平均算法,把样本点的集合S分成k个簇,簇内相似度较高,而不同簇之间的相似度较低,相似度根据簇中对象的平均值来计算,这里的平均值也称为该簇的质心或重心[9～10]。这个算法主要由三个步骤组成:第一步是选取初始的聚类中心,第二步是样本点分类,第三步是聚类中心的调整。其中第二步和第三步需要通过迭代交替进行,即:

1) 从样本点的集合S={x1,x2,…,xn}中随机选取k个初始的聚类中心z1,z2,…,zk;

为克服选取初始中心的盲目性,在伙食费类区调整中可以考虑充分利用已有数据样本点的信息,先确定相隔最两个数据点之间的距离,再采用数据分段技术,将数据样本点集合S均分成k个段,在每段内取一个中心作为初始的中心,这种处理方法可以避免初始中心的选择太靠近,导致迭代次数增加[11]。

初始中心的选择分为四步:

3) 求Ck=S/C;

3　伙食费类区优化评价模型

3.1伙食费类区优化评价原则

伙食费类区调整涉及到方方面面,既要参考物价,又要考虑历史,还要便于调整伙食费,便于伙食费供应核算[1]。故主要原则有四项:

1) 可比性。食物品种的选取,以实物定量标准为基本依据进行统计,具有可变价格的品种;同时,应照顾到全国各个省区。

2) 准确性。物价取值为年度平均价格。

3) 可靠性。调查统计的数据应与国家统计部门发布的物价相比较。

4) 可操作性。尽量选取具有代表性的品种,以简单的表格下发部队进行统计。以驻现有类区的部队为基本统计单位进行统计。

3.2伙食费类区价格评价基本模型

其中:

1)P表示地区物价指标,Pi表示第i类物资的单价(元/kg),Qi表示第i类物资的定量(kg)[12];

2) 价格取样种类共计10种,即i=10;

3) 所有品种定量均按照一类灶取值,总计1450g(副食品)[13]。其中:①畜肉180g(瘦肉70g、五花肉70g、去骨牛羊肉40g);②禽肉(鸡肉)60g;③禽蛋(鸡蛋)70g;④鱼虾90g(鲤鱼50g、带鱼30g、青虾10g);⑤蔬菜750g(油菜、黄瓜、西红柿、土豆、蒜薹、芹菜、长青辣椒、扁豆角、茄子、菜花各1/10);⑥食用菌10g(取平菇100g,按10:1折算成干货);⑦干菜(干木耳)10g;⑧水果200g(富士苹果、梨、香蕉各1/3);⑨牛奶(鲜奶)200g;⑩燃料(燃煤、燃气、燃油三选一,燃煤1000g,管道天然气0.5m3,燃油400g)。

按上述模型,使用原总后军需物资油料部研发的《军队给养信息监测系统》[14],导入国家统计局发布的37个大中城市相应物资每月单价[15],采用物资代码和品名相结合的方法,运用简单平均法即可得到各大中城市主副食的平均价格,代入评价基本模型,得到全国伙食费评价值(西藏自治区全境实物供应,属于实物供应类区,这里不作评价),如表1所示。

表1　全国36个大中城市伙食费评价表

3.3聚类分析算法应用

根据聚类原理,伙食费类区划分就转变为将样本集合S={27.21,20.86,19.09,21.01,18.95,18.99,21.92,20.13,20.11,29.00,22.76,23.39,24.66,18.55,23.87,24.12,18.41,21.41,21.82,18.76,21.18,21.16,26.42,28.73,24.37,18.92,23.76,23.57,23.97,22.90,18.79,21.45,21.13,20.84,20.38,20.55}进行聚类的问题。

鉴于现行的伙食费类区除实物供应类区外分为三类的现状,考虑全国交通运输状况逐步好转,伙食费类区将逐步简化,这里将S聚为三类,即k=3。执行上述算法,输出最优化的聚类结果,初始聚类中心如表2所示,最终聚类中心如表3所示,最终聚类中心间的距离如表4所示,每个聚类中的案例数如表5所示,聚类成员如表6所示。

表2　初始聚类中心

表3　最终聚类中心

表4　最终聚类中心间的距离

表5　每个聚类中的案例数

表6　聚类成员

4　结语

根据上述最优化的聚类结果,可以得到两个结论:一是新的伙食费类区较原伙食费类区划分,有六个城市伙食费类区上调,分别是北京市、南京市、杭州市、成都市、重庆市、贵阳市,有两个城市伙食费类区下调。二是伙食费类区间的差额,一类区与二类区差额为2.41元,二类区与三类区的差额为3.83元,而现行伙食费类区间差额为一类区与二类区差额为1元,二类区与三类区差额为2元,应该有所扩大。

综合来看,聚类分析算法应用于伙食费类区调整是科学的,较好地解决了伙食费类区划分存在的主要问题。

[1] 匡应新.给养勤务学[M].北京:解放军出版社,2008:133.

KUANG Yingxin. Science of Food Service[M]. Beijing: The People’s Liberation Army Press,2008:133.

[2] 中国军事后勤百科全书编写组.中国军事后勤百科全书(军需勤务卷)[M].北京:解放军出版社,2002:267.

Encyclopedia of Chinese Military Logistics Writing Group. Encyclopedia of Chinese Military Logistics(Quartermaster Service Volume)[M]. Beijing: The People’s Liberation Army Press,2002:267.

[3] 范吉昌.给养春秋[M].北京:军事科学出版社,2007:11-30.

FAN Jichang. The History of Food Service[M]. Beijing: Military Science Press,2007:11-30.

[4] 吴翊,李永乐,胡庆军.应用数理统计[M].长沙:国防科技大学出版社,1995:341-357.

WU Yi, LI Yongle, HU Qingjun. Applied Mathematical Statistics[M]. Changsha: National University of Defense Technology Press,1995:341-357.

[5] 伍岳,杨西龙,田雷振.基于灰色聚类的物资战损性分析[J].四川兵工学报,2015(6):66-69.

WU Yue, YANG Xilong, TIAN Leizhen. Analysis of Battle Damage Characters of Materials Based on Grey Clustering[J]. Journal of Sichuan Ordnance,2015(6):66-69.

[6] 汪涛,马永见,尹晓军.基于聚类分析法的人员生活用油类区优化研究[J].军事运筹与系统工程,2010,24(4):65-68.

WANG Tao, MA Yongjuan, YIN Xiaojun. Optimization of Personal Living Oil Area Based on Clustering Analysis[J]. Military Operations Research and Systems Engineering,2010,24(4):65-68.

[7] 胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007,35(2):17-20.

HU Qinglin. YE Nianyu, ZHU Mingfu. Survey of Cluster Analysis in Data Mining[J]. Computer & Digital Engineering,2007,35(2):17-20.

[8] 袁玉波,杨传胜,黄廷祝,等.数据挖掘与最优化技术及其应用[M].北京:科学出版社,2007:50-52.

YUAN Yubo, YANG Chuanshen, HUANG Tinzhu, et al. Data Mining and Optimization Technology and its Applications[M]. Beijing: Science Press,2007:50-52.

[9] 贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007(1):10-13.

HE Ling, WU Lingda, CAI Yichao. Survey of Clustering Algorithms in Data Mining[J]. Application Research of Computers,2007(1):10-13.

[10] 武佳薇,李雄飞,孙涛,等.邻域平衡密度聚类算法[J].计算机研究与发展,2010,47(6):1044-1052.

WU Jiawei, LI Xiongfei, SUN Tao, et al. A Density-Based Clustering Algorithm Concerning Neighborhood Balance[J]. Journal of Computer Research and Development,2010,47(6):1044-1052.

[11] 段桂芹.基于均值与最大距离乘积的初始聚类中心优化K-means算法[J].计算机与数字工程,2015,43(3):379-382.

DUAN Guiqin. Automatic Generation Cloud Optimization Based on Genetic Algorithm[J]. Computer & Digital Engineering,2015,43(3):379-382.

[12] 李锐,冯志.伙食费评价方法研究[J].军事经济研究,2002(9):45-46.

LI Rui, FENG Zhi. The Evaluation Method of Board Expenses[J]. Military Economic Research,2002(9):45-46.

[13] 贺德富,丁文.军人伙食费调整模型修正与实证分析[J].经济师,2007(11):162-164.

HE Defu, DING Wen. The Modification and Empirical Analysis of Mess Expenses Adjustment Model[J]. China Economist,2007(11):162-164.

[14] 贺德富,董奎,方景帅.部队生活水平与物价监测研究[J].军事经济研究,2013,34(10):74-78.

HE Defu, DONG Kui, FANG Jingshuai. Research on Monitoring of Troops Life Standard and the Level of Prices[J]. Military Economic Research,2013,34(10):74-78.

[15] 中华人民共和国国家统计局.国家数据[DB/OL]. http://data.stats.gov.vn/workspace/index?m=hgyd.

China Statistics Bureau. National Data[DB/OL]. http://data.stats.gov.vn/workspace/index?m=hgyd.

Classification of Mess Grade Area Based on Clustering Analysis

HE DefuSU Xisheng

(Department of Quartermaster, Military Economics Academy, Wuhan430035)

The classification of mess grade area is an important work to formulate the standard of mess expenses. At present, the mess grade area doesn’t reflect the price level around the country, which is based on the classification in 1988. The optimization of mess grade area is a cluster analysis problem in essence, that is, the various regions mess expenses are evaluated according to the unified evaluation standard of mess expenses firstly, and then the various regions are classified by using the cluster analysis algorithm. The results show that 6 cities should be up and 2 cities should be cut in the new mess grade area. The difference interval between the 3 mess grade area should be adjusted to 2.41, 3.83 Yuan.

provisions, mess grade area, clustering analysis, application

2016年3月17日,

2016年4月23日

全军后勤重大项目子项(编号:AS211R001-15)资助。

贺德富,男,博士,副教授,硕士生导师,研究方向:军需勤务与信息化。苏喜生,男,博士,教授,博士生导师,研究方向:后方专业勤务与信息化。

TP393.09; E233DOI:10.3969/j.issn.1672-9722.2016.09.004

基于聚类分析算法的伙食费类区划分研究*

1 引言

2 聚类分析算法

3 伙食费类区优化评价模型

4 结语

1　引言

2　聚类分析算法

3　伙食费类区优化评价模型

4　结语