增一型分层模糊系统结构的PCA优化方法

2013-03-20 06:49周贺松
郑州大学学报(理学版) 2013年2期
关键词:输入量输出量代价

王 杰, 周贺松

(郑州大学电气工程学院 河南郑州450001)

0 引言

模糊系统是当前智能控制理论与应用研究领域中最活跃的分支之一.随着模糊系统理论的成熟,模糊系统在越来越多的领域取得了成功的应用.

在模糊系统建模方面,随着输入变量个数的增加,模糊规则总数将会呈指数增加,规则数的大量增加会导致模糊控制器的失灵,这就是“维数灾”问题.“维数灾”的出现一方面造成了推理计算的复杂性,另一方面也限制了人工经验的引入[1].通常情况下人们会减少输入变量对模型进行简化,但这样无疑会降低模型的精度.1991年,Raju等[2]提出了一类分层模糊系统,为解决“维数灾”问题开辟了一个新的研究方向.目前对分层模糊系统的研究主要集中在分层模糊系统的拓扑结构、通用逼近性[3-4]、控制方法[5-6]、等效性[7]以及系统设计[1,8-9]等方面,而对分层结构的研究则较少涉及.

分层模糊系统有多种分层结构,对分层结构的研究就是为了解决怎样选择最优分层结构的问题.可以通过“试凑法”来选择最优结构,但是这样工作量就会成倍增加.当分层结构太多时,“试凑法”就变得难以实现了.作者把主成分分析引入到“增一型”分层模糊系统,对输入变量进行空间映射,得到新的输入变量,新变量按照包含原有输入量信息的多少排序,最后根据新变量的贡献率构造出了代价函数.通过水泥窑生产过程仿真,验证了该方法的有效性.

1 “增一型”分层模糊系统

由于“增一型”分层模糊系统的通用逼近性已经得到证明,且采用“增一型”分层模糊系统的规则总数随着输入量个数的增加线性增长,规则总数相对其他分层模糊系统是最少的[2].

“增一型”分层模糊系统如图1所示,x1,x2,x3,x4,…,xn表示n个实际的物理输入量,yi表示第i层模糊单元的输出,也是第i+1层模糊单元的输入,共有n-1个模糊单元.

由图1可知,整个“增一型”分层模糊系统由一个个的模糊单元串联而成,每个模糊单元有两个输入量,其中,第一层的模糊单元输入量是两个实际的物理输入量,其余层的输入量是前一层的输出量和另外一个物理输入量.

文献[10]指出,对于一个n个输入变量的“增一型”分层模糊系统,假设每个输入量有m个模糊子集Ap,i=1,…,n;p=1,…,m,每个模糊单元采用T-S推理方式,采用加权平均解模糊方法,则有第一层模糊单i元的输出:

式中,h1pq(x1,x2)为线性或者非线性函数,μA1p(x1),μA2q(x2)为A1p,A2q相应的隶属度函数.

推广到第l层模糊单元,第l层模糊单元的输出为fl(yl-1,xl+1)=yl

图1 “增一型”分层模糊系统结构Fig.1 Structure of increase-type hierarchical fuzzy system

式中,y0=x1,C0=A1.

对于整个“增一型”分层模糊系统,有

由式(3)可知,同一个输入量放在不同的层对输出的影响大小是不一样的.第一层的输入量x1,x2影响到所有的n-1个模糊单元,第二层的输入量x3影响到除第一层外的n-2个模糊单元,依次类推,第n-1层的输入量xn值的变化仅仅影响到最后1个模糊单元.

在图1中,把n个输入量中的2个输入量作为第一个模糊单元的输入,有C2n种组合,剩下的n-2个输入量中的1个输入量作为第二个模糊单元的输入,有C1n-2种组合,剩下的n-3个输入量中的1个输入量作为第三个模糊单元的输入,有C1n-3种组合,依次类推,最后的一个输入量作为第 n-1个模糊单元的输入.这样对于有n个输入的“增一型”分层模糊系统,分层结构就有种组合,采用不同的分层结构必然会影响到最终模型的精度.

2 基于主成分分析的代价函数构造

2.1 代价函数

作者构建的是关于输入量贡献率的代价函数.模型精度是衡量模型好坏的最重要指标.模型误差越小,精度越高,该模型越能描述系统各变量之间的相互关系.基于此,作者用模型误差来验证代价函数是否有效.

在图1中,设输入量x1对输出量y的贡献率为m1,输入量x2对输出量y的贡献率为m2,输入量x3对输出量y的贡献率为m3,…,输入量xn对输出量y的贡献率为mn.由于x1,x2,x3,…,xn位于不同的输入层,因此它们对输出量y的贡献权重是不同的,设∂1,∂2,…,∂n-1分别为第1,2,…,n-1输入层对输出的权重系数.

该分层结构对输出的整体贡献量M=∂1(m1+m2)+∂2m3+…+∂n-1mn,M值越大,说明该分层结构所包含的信息量越多,该结构越能充分表达输入量与输出量之间的关系,由该分层结构建立的模型误差越小.

定义代价函数C为整体贡献量M的倒数,则有

由式(3)可知

权重系数反映着输入量对整个模糊系统的影响大小,在数学上可以用求偏导数的形式实现.每个输入层的权重系数如下:

由于x1,x2是第一层模糊单元的输入量;f1,x3是第二层模糊单元的输入量;…;fn-2,xn是最后一层(n-1层)模糊单元的输入量.每个输入量对该层模糊单元的权重系数反映该模糊单元对输入量的灵敏度,每个模糊单元对其输入量的灵敏度是相同的.因此有

式(4)可以简化为

式中,∂为权重因子,m1,m2,m3,…,mn为变量对输入的贡献率.

采用主成分分析的方法求输入量的贡献率.权重因子∂的取值与具体的输入量和输出量有关,可以通过以下步骤确定∂的值.

①分别求出xn和y的一阶微分项Δxn,Δy.y为输出量,xn是最后一层的实际物理输入量.Δxn,Δy都是列向量.

②求两组列向量的点除值∂x,∂x=Δy/Δxn.

2.2 主成分分析

主成分分析(PCA)是一种简化数据集的技术.它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的几个正交方向.

文中用到主成分分析法中的空间变换思想,对主成分分析法稍微做了修改.设原变量为x1,x2,…,xn,用主成分分析法对原变量进行空间映射后得到新的变量z1,z2,…,zn均是原变量的线性组合[11].新变量z1包含的信息量大于z2,z2包含的信息量大于z3,依次类推.

步骤如下:

①数据标准化处理:

xij表示原变量xj的第i个值表示xj的平均值,Sj表示第j个变量的标准差.

②矩阵[yij]I*n的相关矩阵 R.

③计算相关矩阵R的特征值λj和特征向量uj,并按特征值从大到小排列.

④求变换后的变量,zj=[x1x2x3x4]*uj.

3 实例验证

为了验证文中提出的代价函数的有效性,以水泥生产过程中的回转窑分解炉出口压力为被控量进行建模,通过数据的关联分析和相关的工艺知识,确定其输入量为:五级筒出口压力,预燃室出口压力,三次风压力,窑尾提升机电流,分解炉喂煤秤喂料速度,分解炉出口压力历史值(k-1).

因为输入变量个数为6,采用“增一型”分层模糊系统,其分层结构有C26C14C13C12C11=360种,分层结构太多,对用“试凑法”验证代价函数的有效性带来不便.对模型进行简化,选择6个输入量中最具代表性的3个输入量:x1五级筒出口压力,x2预燃室出口压力,x3分解炉出口压力历史值(k-1).简化后的模型有C23C11=3种分层结构,一共有两个输入层.

进行主成分分析后得到特征值 λ1=1.880 1,λ2=0.666 1,λ3=0.453 8,对应的特征向量为

对原有输入变量用主成分方法进行空间映射得到新的输入量:

新变量 z1,z2,z3均是原变量 x1,x2,x3的线性组合,对原变量的贡献率分别为 0.626 7、0.222 0、0.151 3.

把变量z1,z2放在第一层,z3放在第二层,构成第一种分层结构.权重因子∂==1.489 4,这种结构的代价函数

把变量z1,z3放在第一层,z2放在第二层,构成第二种分层结构.权重因子∂==1.253 0,这种结构的代价函数

代价函把变

量z2,z3放在第一层,z1放在第二层,构成第三种分层结构.权重因子∂==1.347 4,这种结构的

上述三种分层结构按代价函数从小到大排序为

按照代价函数应该选择第一种分层结构.

把新输入变量z1,z2,z3和输出量 y代入ANFIS训练分层模糊系统得到各种分层结构的训练均方根误差,选取训练数据的前100个点绘制误差率曲线(图2~4).

结构一、结构二、结构三的均方根误差分别为7.623,8.724,8.636.

比较三种结构的误差曲线及均方根误差,按从小到大排序为:结构一<结构三<结构二,这个顺序和按照代价函数的排序是一致的,从而证明了该代价函数的有效性.

图2 结构一的误差率曲线Fig.2 Error rate curve of structure one

4 结论

在模糊系统建模中,随着输入量个数的增加,模糊规则数将呈指数增加,这样会使模型训练的时间大幅度增加,而分层模糊系统可以极大地减少规则数,缩短训练时间.在通常情况下,只有输入量个数在4个以上才考虑使用分层模糊系统.n个输入变量会有C1C1C1…C1种分层结构,不可能对所有的分层结构建立各nn-2n-32自的模型,通过比较选择最优模型.作者对“增一型”分层模糊系统的结构进行了研究,提出了基于贡献率的代价函数,比较代价函数大小来选择最优的分层结构.在验证代价函数有效性的时候,为简便起见,把系统简化为三输入一输出.该代价函数在多维输入量下依然可以使用.

[1] 朱晓东,王杰.基于分层模糊系统的石油钻进参数预测模型[J].石油学报,2010,31(5):838-842.

[2] Raju G V S,Zhou Jun.Hierarchical fuzzy control[J].Interntional Journal of Control,1991,54(5):1201 -1216.

[3] 张香燕,张乃尧.一般二叉树分层模糊系统的通用逼近性[J].清华大学学报:自然科学版,2007,47(1):143-146.

[4] 孙多青,霍伟.具有任意形状隶属度函数的分层模糊系统逼近性能研究[J].控制理论与应用,2003,20(3):377-381.

[5] 孙多青,霍伟.基于分层模糊系统的直接自适应控制[J].控制与决策,2002,17(4):465-472.

[6] 孙多青,霍伟.基于分层模糊系统的间接自适应控制[J].北京航空航天大学学报,2003,29(4):303-307.

[7] 王健,张香燕,张乃尧.一类二叉树型分层模糊系统的等效性分析[J].清华大学学报:自然科学版,2007,47(7):1237-1240.

[8] 王杰,李广,朱晓东.基于分层模糊推理的石油钻进事故预警系统[J].微计算机信息,2008,7(25):177-178.

[9] 王杰,吴国曾,朱晓东.实时录井信号小波分析中的右边界动态处理[J].郑州大学学报:理学版,2010,42(3):84-90.

[10] Wang Lixin.Analysis and design of hierarchical fuzzy systems[J].IEEE Transactions on Fuzzy Systems,1999,7(5):617 -624.

[11]傅湘,纪昌明.区域水资源承载能力综合评价[J].长江流域资源与环境,1999,8(2):169-172.

猜你喜欢
输入量输出量代价
低合金高强度结构钢Q390ME 焊接接头组织性能研究
电流互感器测量结果不确定度评定
如东需求锐减过半,海南缩减85%! 一代苗输出量2000亿尾,未来前景看好
输入量与尿量比在深Ⅱ度烧伤患者休克预防性补液中的应用分析
词块输出量对二语写作的影响
观察倍他乐克、雅施达联合治疗慢性心力衰竭的临床疗效
爱的代价
多输出量测量模型的不确定度评定方法
幸灾乐祸的代价
代价