1种基于密歇根编码的模糊分类系统设计方法

2016-10-17 01:24胡智鹏
关键词:解释性适应度遗传算法

胡智鹏,马 铭

(北华大学信息技术与传媒学院,吉林 吉林 132013)



1种基于密歇根编码的模糊分类系统设计方法

胡智鹏,马铭

(北华大学信息技术与传媒学院,吉林 吉林132013)

兼顾模糊系统精确性和解释性,提出1种基于遗传算法的模糊分类系统设计方法.该算法在考虑模糊分类系统解释性的前提下,基于数据样本构建完整的规则集,并采用密歇根编码方式优化规则集和隶属函数参数,在保证系统解释性的同时提高了系统的精确性,仿真实验结果验证了该方法的有效性.

模糊分类系统;模糊规则;遗传算法

【引用格式】胡智鹏,马铭.1种基于密歇根编码的模糊分类系统设计方法[J].北华大学学报(自然科学版),2016,17(5):689-692.

模糊分类系统具备处理不确定信息的能力,因此,模糊分类理论在各领域都得到了广泛应用[1-2].模糊分类系统可以依据相关数据由领域内的专家构建,但是大多数情况下,要么相关数据不够完整,要么专家经验无法获得,使快速准确地从数据中构建模糊分类系统成为近几年研究的热点问题[3].模糊分类系统主要有基于模糊聚类、基于遗传算法和基于模糊神经网络3个研究方向[4].

准确性(Accuracy)和解释性(Interpretability)是评价一个模糊分类系统的两个重要指标[5].模糊分类系统的解释性是模糊分类系统区别于其他分类系统的一个重要特征,在工业、运输、医学等领域,解释性的优劣显得尤为重要[6].本文提出1种基于密歇根编码的模糊分类系统设计方法,该算法在保持系统稳定的前提下,可以减少模糊规则,提高系统的解释性.算法使用数据样本生成完整规则集,通过遗传算法优化规则集.在遗传算法编码过程中,使用密歇根编码;在选择操作中,提出1种新的选择策略保持系统精度;在变异操作中,引入词语计算防止系统早熟.通过仿真实验验证该方法的有效性.

1 模糊空间划分与规则构建

1.1模糊空间划分

模糊系统的结构辨识主要是通过对数据样本输入输出空间的模糊划分和模糊规则的确定来实现.模糊空间的划分方法主要包括网格法、聚类法和决策树法,本文使用网格法对数据样本进行划分.网格法的主要思想是按照指定的划分方式来划分模糊空间,划分过程中每个输入变量域都是等量划分,其中每个等分点即为相应隶属函数中心.设输入变量的划分点为相邻隶属函数的交点,划分后的模糊空间为模糊网格[7].网格法构建的模糊系统是一种完备的模糊系统,保证了模糊分类系统的解释性.

在模糊空间划分问题中,选择什么样的隶属函数很重要,恰当地选择隶属函数可以提高系统性能.隶属度函数的确立并没有严格的要求,大多数模糊系统的隶属函数都是根据经验确立的,本文结合网格法采用三角隶属函数划分样本点特征.三角隶属函数结构简单、易于描述,有助于降低系统运行的时间复杂度,提高系统的解释性.

1.2构建模糊规则集

导入数据样本,用5个三角隶属函数对已知样本点的每个特征值进行模糊划分.三角隶属函数表示为

其中:a,b,c分别为三角隶属函数的3个顶点;x为数据样本点.

考虑到模糊分类系统的完整性,在算法初期将分类系统全部规则作为初始规则集.模糊规则前件表示为

其中:m为初始种群规模;n为数据样本的属性数量.

分别计算每个样本对每一条规则的激励强度

其中:n为当前训练样本的属性数量,那么,uji(xi)即为隶属度函数值.再分别计算每条规则在各分类上的激励强度之和

式中:uj(x)为第j条规则在样本点x当前分类上的激励强度;c为样本所属类别.将βclass(Rj)值最大分类计为该规则的后件,整理并存入后件集合R2;将模糊规则前件R1与模糊规则后件R2合并得到初始模糊规则集R.

2 算法描述

利用遗传算法优化模糊规则集,选择优秀个体遗传至下一代,变异时引入词语计算,扩大算法搜索空间,提升系统多样性.

2.1编码

模糊分类系统在通过遗传算法生成模糊规则集时主要使用两种学习方法:一种是1978年提出的密歇根法(Michigan approach);另一种是1980年提出的匹兹堡法(Pittsburgh approach).

密歇根编码的主要特征是遗传算法中每条染色体对应模糊分类系统的一条模糊规则,在分类器中根据个体激励强度进行选择、复制、交叉、变异等操作,算法最终将会得到一组最优规则集[8].密歇根类型分类系统在选择操作上优先选择适应度较大个体,这样就会造成有一些针对个别样本适应度较小的个体被忽略,进而造成早熟,降低了系统多样性.

与密歇根编码不同,匹兹堡编码的主要特征是遗传算法中每条染色体都是模糊分类系统的完整规则集.虽然算法避免了单条规则之间的相互冲突,但由于每一代都需要同时评价多个规则集,在计算量上也是巨大的.在交叉操作中将规则集对应规则进行互换,这也使得单条规则的性能改变受到阻碍,进而降低了进化效率[8].

图1 编码
Fig.1 The coding operation

本文采用密歇根编码,模糊分类系统中的每条规则即为1条染色体.每条染色体由规则前件R1和规则后件R2组成,其中,规则前件R1又由三角隶属函数参数组成.见图1.

2.2适应度函数

在计算适应度时,需要计算数据样本每条规则的激励强度,值最大的规则获胜,该规则后件标识的类别数就是这个样本的类别.分别统计初始种群中每个个体正确分类样本数总和,即为该个体适应度值.适应度函数

2.3遗传操作

在进行遗传操作前,还需要做些准备工作.由于上述构建的初始种群个体数目庞大,为提高模糊分类系统的准确性,用训练样本调整初始种群个体数目,依次计算初始种群中每个个体的激励强度,根据激励强度值对初始种群中的个体进行排序,选择指定种群规模个体数目.本文在遗传操作中使用“赌轮法”计算每个个体的赌轮概率,最后依据赌轮指针变量Rnd停留区域选择当前赌轮概率所对应的优秀个体遗传至下一代.由于赌轮指针为随机指向,所以在选择个体时,可能会出现在某个分类上选不到任何规则的情况.为了避免这种情况的发生,文献[4]在选择策略上提出了1种删除相似个体的方法,该方法需要计算出每条染色体三角函数参数的相似度,再将相似度大的规则随机删除.虽然该算法在一定程度上确保了规则集的多样性,但同时也可能将适应度较大的精英个体删除.为了保证随机选择的后代在每个分类上都有模糊规则,本文采用了一种“保底策略”方案,先计算种群每个个体的适应度函数值,再按分类对全部个体按适应度函数值排序,找出每个分类上适应度函数值最大的个体直接作为父代遗传到下一代,其余个体通过赌轮选择.这样既保证了遗传后代在各分类都有模糊精英规则,进而保证了系统的精确性,又有小概率选中适应度较小的边缘规则,保持了系统的多样性.

依据赌轮选择顺序,对每对个体的随机属性按照交叉概率进行单点交叉,扩大算法搜索空间.若赌轮选择个体数为奇数,则最后一个个体不进行交叉操作直接遗传至下一代,见图2.

图3 变异
Fig.3 The mutation operation

按照变异概率,在种群中随机找到1条规则并随机变异1个属性的全部三角隶属函数参数,见图3.

在变异操作中引入词语计算提升系统多样性.对于随机选择的三角隶属函数参数ain,bin,cin进行如下操作:在指定范围随机生成变异算子δ,则变异后新三角隶属函数的顶点

由算法得到的模糊规则集中存在一些重复规则,对模糊规则集进行排序,删除重复规则.

3 仿真实验

本文使用Iris数据集对系统进行测试.Iris系统是一个典型的分类系统,多年来一直被学者们作为分类算法的评估标准.Iris数据集具有4维150个样本点,共分成3类,每类50个样本点.其中,第1类与第2类相互独立,第2类与第3类有部分交叉.

实验采用密歇根编码,交叉概率为0.9,变异概率为0.1,种群规模为30,迭代次数为1 000代.数据集的2/3作为训练样本,1/3作为测试样本.系统运行50次,用测试样本被正确分类总数与测试样本总数计算得出系统准确性平均值,运行结果见表1.结果表明,该算法在少许损失系统精确性的情况下,获得了较好的解释性.

表1  Iris数据集50次运行结果

4 结  论

基于密歇根编码的改进遗传模糊分类系统在设计上保证了系统的完整性,避免了模糊分类系统中一些孤立规则的丢失.算法用数据样本构建和调整初始规则集,用遗传算法优化规则集,在考虑算法精确性的同时在一定程度上提高了解释性.仿真结果验证了该算法的有效性,其运算速度较快并且保证了系统的解释性,但在精确性方面有所下降.因此,提高模糊系统的精确性,将是下一步研究的重点.

[1] 邢宗义,侯远龙,贾利民.基于多目标遗传算法的模糊分类系统设计[J].东南大学学报(自然科学版),2006,36(5):725-731.

[2] 张永,邢宗义,向峥嵘,等.基于聚类和遗传算法的解释性模糊模型设计[J].计算机工程,2007,33(8):160-162.

[3] 黄卫华.基于解析结构的模糊控制系统设计及稳定性分析[D].武汉:武汉科技大学,2010.

[4] 李继东.遗传模糊分类系统构建中规则获取和解释性优化的关键技术研究[D].昆明:云南大学,2011.

[5] 纪红,齐芳,马铭.一种基于解释性的遗传模糊分类系统设计方法[J].北华大学学报(自然科学版),2015,16(4) :538-541.

[6]WesleyJCole,JoshuaDRhodes,WilliamGorman,et al.Community-scaleresidentialairconditioningcontrolforeffectivegridmanagement[J].AppliedEnergy,2014,130(5):428-436.

[7]UpshawCR,RhodesJD,WebberME.ModelingpeakloadreductionandenergyconsumptionenabledbyanintegratedthermalenergyandwaterstoragesystemforresidentialairconditioningsystemsinAustin[M].Texas:EnergyandBuild,2015.

[8]WangD,JiaH,WangC,et al.Performanceevaluationofcontrollingthermostaticallycontrolledappliancesasvirtualgeneratorsusingcomfort-constrainedstate-queueingmodels[J].LetGenerationTransmission&Distribution,2014,8(4):591-599.

[9]WuTP,ChenSM.Anewmethodforconstructingmembershipfunctionsandfuzzyrulesfromtrainingexamples[J].IEEETransSystemManCyberneticPartB,1999,29(1):25-40.

[10]IshibuchiH,NakashmiaT,MurataT.Three-objectivegenetics-basedmachinelearningforlinguisticruleextraction[J].InformationSciences,2001,136(1-4):109-133.

[11]ShiY,EberhartR,ChenY.Implementationofevolutionaryfuzzysystem[J].IEEETransFuzzySystems,1999,7(2):109-119.

【责任编辑:郭伟】

A Method of Designing Fuzzy Classification System Based on Michigan Encoding

Hu Zhipeng,Ma Ming

(Information Technology and Media College of Beihua University,Jilin 132013,China)

Considering the tradeoff between the accuracy and the interpretation of the fuzzy system,a design method of fuzzy classification system based on genetic algorithm is proposed.The new algorithm in consideration of fuzzy classification system interpretability,a complete set of rules is constructed based on the sample data,and the Michigan encoding of rule sets and membership function parameters were optimized in ensuring the interpretative system and improving the accuracy of the system.Simulation results verify the effectiveness of the proposed method.

fuzzy classification system;fuzzy rules;genetic algorithm

1009-4822(2016)05-0689-04

10.11713/j.issn.1009-4822.2016.05.029

2016-04-15

吉林省教育厅科学技术研究项目(2012126);吉林省科技厅自然科学基金项目(20140101185JC).

胡智鹏(1982-),男,硕士,讲师,主要从事遗传模糊系统及其应用研究,E-mail:27380605@qq.com;通信作者:马铭(1969-),男,博士,教授,主要从事智能计算和模式识别研究,E-mail:931406363@qq.com.

TP181

A

猜你喜欢
解释性适应度遗传算法
改进的自适应复制、交叉和突变遗传算法
论行政自由裁量的“解释性控权”
基于遗传算法的高精度事故重建与损伤分析
基于遗传算法的模糊控制在过热汽温控制系统优化中的应用
基于遗传算法的智能交通灯控制研究
英汉互译中的认知隐喻翻译探究
启发式搜索算法进行乐曲编辑的基本原理分析
一种基于词语计算的模糊分类系统的设计方法
基于人群搜索算法的上市公司的Z—Score模型财务预警研究
基于改进多岛遗传算法的动力总成悬置系统优化设计