多模型自适应控制理论及应用

2020-06-04 09:39张玉振张维存杨宇航
工程科学学报 2020年2期
关键词:适应控制权值局部

张玉振,李 擎,张维存,杨宇航

北京科技大学自动化学院,北京 100083

鲁棒和自适应两个性能是控制理论追求的最高境界[1−2],多模型方法是实现鲁棒自适应控制的一个重要途径,多模型自适应控制主要包括切换和加权两大类综合方式,其不同的综合策略关系着多模型的分解以及系统框架的构建.考虑到切换多模型自适应控制的研究已经比较成熟,比如稳定性分析、镇定控制设计等方面[3−5],均取得了丰富的研究成果[6].相较而言,加权多模型自适应控制仍然存在较多问题,所以本文只关注加权多模型自适应控制.多模型的思想最初于20世纪60年代由Magill提出[7]并被应用于含不确定参数的随机系统的状态估计,即加权多模型自适应估计(multiple model adaptive estimation,MMAE).随后,Lainiotis和Athans等[8−10]提出用多模型方法进行自适应控制,即加权多模型自适应控制(multiple model adaptive control,MMAC),其局部控制器采用线性二次高斯(linear quadratic Gaussian,LQG)控制.之后其应用范围不断扩大,包括在故障诊断[11]、医疗[12]、目标跟踪[13]、航空[14]、过程控制[15]等领域的应用,且又不断有一些相关的理论研究成果出现[16−18].近年来加权多模型自适应控制的研究又越来越多地受到人们的关注,比如,通过设计鲁棒控制器作为其局部控制器,进而构成鲁棒多模型自适应控制方法[1,19](包括收敛性分析[20]、模型集[21]、性能指标[22]以及应用[23]等方面研究),以及采用模糊规则的多模型自适应融合控制[24−25],等等.从国内来讲,学者们对加权多模型自适应控制的理论及相关应用的研究比较晚,特别是80年代以前几乎是空白,1988年以后才有相关研究成果出现[26],后续不断有相关应用成果[27−29]及理论研究进展[30−32].

加权多模型自适应控制,作为一种对切换型方法的延展,即“软切换”,其与增益调度控制或基于Takagi-Sugeno(T-S)模型的模糊控制在某种程度上相类似.该方法对于存在有限多个参数不确定的随机系统的控制非常适宜,并逐渐在各种领域开展研究,尤其是在航空领域的飞行控制,汽车领域的主动悬架控制和医疗领域的药物输入控制等方面应用,比如通过对输入药物速率进行加权多模型自适应控制,以达到调节患者平均动脉压以及心输出量的目的,并在动物试验中获得比早先采用的多重药物控制器更佳的性能[12].此外,在复杂多变的太空环境下,空间机器人是具有高度非线性、强耦合和大范围不确定性的复杂系统,通过对柔性机械臂的加权多模型自适应控制,实现对运动位置的精确跟踪以及柔性结构的振动抑制,满足其精确灵活、强适应性的现实需求.

加权型多模型自适应控制系统的稳定性问题曾经是一个公认的难题,相关论述见文献[1, 25−28, 31, 33].2010年以来,各种加权多模型自适应控制系统的稳定性结果相继出现,尤其是基于虚拟等价系统理论的一般意义下的稳定性分析,取得了一些进展.

关于经典加权算法收敛性的理论研究见文献[34−36],Lainiotis分割算法收敛性能分析见文献[37],但由于经典加权算法是基于Kalman滤波、动态假设检验以及贝叶斯后验概率公式进行递推计算的,因此分析复杂且要求条件比较苛刻,可以大致归纳为:各个模型所产生的输出误差信号需要满足平稳性、遍历性,以及模型输出误差之间可以区分,细节见文献[1].

本文首先介绍加权多模型自适应控制的发展历史,然后给出最新的相关研究进展及其代表性工作,最后指出需要继续研究的一些问题.

1 常规多模型自适应控制

1.1 经典多模型自适应控制

经典多模型自适应控制(classical multiple model adaptive control,CMMAC)指的是早期出现的加权多模型自适应控制,其采用LQG策略设计局部控制器.其最主要的特点是系统状态估计与控制是绑定的,具体而言,其局部控制器乃至全局控制器都要依赖于状态估计进行设计.具体的系统原理[1]如图1所示.

图中KFi(Kalman filter)代表卡尔曼滤波器,i=1,···,N.由各局部的卡尔曼滤波器给出各自的状态估计而整体的状态估计为各个局部控制器按照线性二次增益计算各自的局部控制量−Gi为线性二次增益.而整体控制量为系统输出为y(t).后验概率估计器(posterior probability estimator,PPE)用于计算加权值Pi(t)[1,7].图1中,Si为离线计算得到的第i个卡尔曼滤波器的稳态残差ri(t)的方差矩阵.实际上,经典多模型自适应控制的加权算法完全继承了加权多模型自适应估计的加权算法.

图1 经典加权多模型自适应控制系统框图Fig.1 Block diagram for CMMAC

1.2 鲁棒多模型自适应控制

鲁棒多模型自适应控制(robust multiple model adaptive control,RMMAC)仍然属于加权多模型自适应控制,具体来说,它是在CMMAC的基础上,结合了现代鲁棒控制系统设计方法(包括H∞鲁棒控制器设计方法,μ综合法鲁棒控制器设计方法等最新成果,其中H∞为定义在Hardy空间上的范数,μ为结构奇异值)并利用MATLAB的相关工具来设计局部控制器,并对CMMAC的结构做了如下修改:CMMAC的局部控制器采用的是状态反馈来产生局部控制量,而RMMAC的局部控制器采用的是基于μ综合法设计的动态输出反馈来产生局部控制量,从另一个方面来说,CMMAC中的卡尔曼滤波器既用于权值的计算(利用其产生的残差序列),也用于局部控制器的状态反馈控制(利用其状态估计结果),而RMMAC中的卡尔曼滤波器只用于加权值的计算,而与局部控制器无关,这样一来使得估计(辨识)子系统与控制部分隔离开来.RMMAC系统的原理[1]如图2所示,图中,Ki(t)为 局部控制器,i=1,···,N.

值得指出的是,RMMAC的加权算法与CMMAC的加权算法是完全一样的,当然也和MMAE的加权算法完全一致.

文献[1]的RMMAC结构图及相关论述中,都忽略了一点:加权值只能在离散时刻进行计算得到Pi(k),必须经过(零阶)保持器才能得到连续的加权值Pi(t).

RMMAC和经典加权自适应控制一样,存在以下问题:

(1)由于采用了多个卡尔曼滤波器,使得计算过程繁琐,并且需依赖于初始条件;

(2)闭环稳定性难以分析;

(3)加权算法的收敛条件苛刻.

加权算法的收敛性难以分析并且要求条件较多,这并非RMMAC独有的缺点,而是只要采用经典加权算法都会有此问题存在.

1.3 基于模糊融合的多模型自适应控制

为了克服基于Kalman滤波器、动态假设检验以及贝叶斯后验概率公式的权值算法中存在的上述缺点,Kuipers和Baldi等提出采用模糊规则取代基于Kalman滤波和动态假设检验来计算权值的办法,直接依据隶属度函数来计算权值[24−25],此类方法实质上是多个控制器间的“模糊融合(Fuzzy Fusion)”,其计算量相对减少,易于实现.

该类方法根据参数辨识结果和模糊规则计算出加权值,再将加权值与各个局部控制器产生的局部控制信号进行加权融合,得到全局的控制输出.每个局部控制器的设计与RMMAC一样,也是基于H∞鲁棒控制器设计方法或 µ综合法鲁棒控制器设计方法来设计的动态输出补偿器(控制器).采用模糊融合方法的MMAC系统原理[24]如图3所示,图中,θ(t)为系统辨识参数.

图2 鲁棒多模型自适应控制系统框图Fig.2 Block diagram for RMMAC

图3 采用模糊融合的多模型自适应控制系统框图Fig.3 Block diagram for MMAC using fuzzy fusion

但是,此类方法也有一定的问题存在,首先是离线获取准确的模糊规则隶属度函数并非易事;其次是该方法需要在线参数估计,因此为了参数估计的一致收敛性,需要附加持续激励信号,这是控制系统所不希望的.

2 其他多模型自适应控制

近年来,Zhuo和Narendra提出了在被控对象的多个模型参数上进行加权融合(凸组合),这可以理解为第一层自适应;然后根据融合后的模型设计自适应控制器,这是第二层自适应.这类方法实际上是在参数估计的层面上引进了加权思想,也取得了很好的理论和仿真实验结果[38].文献[39]在此基础上设计了若干个在线辨识的模型和一个固定的模型,通过仿真研究验证了控制系统的优异性.此外,文献[40−42]针对含有参数大范围不确定性的随机系统提出了新的加权算法和相应的加权多模型自适应控制系统,并在文献[43−44]中对该控制系统的稳定性进行了分析,取得了令人满意的仿真效果.同时,文献[45]给出了相应获得的实际应用成果.

随着多模型和神经网络的不断发展,文献[46]提出了一种基于多模型和神经网络的非线性控制系统框架,但该系统全局输入输出有界的稳定性条件较为苛刻,文献[47−48]拓展了此类多模型自适应控制的适用范围,文献[49−50]针对一类非线性离散时间系统,基于鲁棒控制方法和神经网络设计相应的非线性自适应控制器,形成一种新型的多模型自适应控制,放宽了系统非线性项的条件.此外,文献[51−53]给出了采用不同的神经网络结构设计相应的多模型自适应控制系统,通过神经网络辨识未知动态系统,建立自适应模型,然后将其与固定模型进行不同形式的组合,组成模型集,经仿真实验对比,体现了控制性能的提高.在上述的多模型自适应控制系统中,神经网络基本都被用于辨识,然后据此设计控制器,取得了一定的研究成果.然而,当神经网络直接作为控制器时,控制系统也能获得良好性能,因此,通过对局部模型设计相应的神经控制器,以加权和的形式进行融合,构成多神经网络自适应控制,虽然该方法仍然存在一些问题,但其是多模型自适应控制解决更加复杂的非线性系统的一种重要方法.

对于自适应容错控制而言,当故障发生时,保证瞬态性能的良好是其控制系统的挑战性问题.多模型自适应容错控制系统是一种改善系统瞬态性能的重要方法[54],其通过适当的加权算法或切换规则,确保故障后获得最适宜的控制器[55−57],有效补偿各种故障造成的不良影响,并不断在飞行器控制中得到应用[58−59].文献[60]提出了一种多层级多模型自适应方法,当故障发生时进行补偿控制,通过不同层级覆盖不同的故障模式(结构),参数区间和局部控制器的自适应增益更新,并在波音747系统的仿真中获得了优良的控制性能.文献[61]针对直升机飞行操控系统,采用基于多模型思想的直接自修复方法,保证了系统性能,并且在数值仿真和试验平台上取得了较好的控制效果.

3 建模、加权算法与稳定性分析

加权多模型自适应控制系统主要由模型集、加权算法以及局部控制器三部分组成.其中,局部控制策略经历了从早期的LQG控制策略到现在的鲁棒控制策略,实际上任意具有一定鲁棒性的控制策略都可以被采用,鉴于涉及内容太过广泛,此部分不做过多阐述.对于模型集的选择,其属于建模问题,对此问题的研究主要涉及到模型差异度的度量问题[62].另外,简单实用的加权算法和一般意义下的稳定性分析也是系统的重要研究内容.

(1)模型集.

关于模型集的建立,其构成形式由全部固定模型发展到含有自校正模型的模型库,其建立策略也从根据先验数据离线建模发展到通过在线学习动态优化模型库,从而在不断更新模型库的同时,有效控制模型数量,防止模型冗余[63].其中,利用模糊聚类学习算法是建立局部模型的一类重要方法[64−66],在此基础上,文献[67]利用在线数据进而实现局部模型参数的修正.此外,文献[68]采用自适应混沌差分进化算法对模型数量和模型参数同时优化,文献[69]基于参数定位思想设计最优参数子集,从而达到降低模型数量的目的.上述各种策略,实际上都是为了使模型集能够有效地覆盖并逼近被控对象而不断发展的.

(2)加权算法.

在加权算法方面,从早期的加权算法[1,7]到后来的模糊融合算法[24−25],以及不断改进的算法[70−71]都可以被采用,文献[40]提出了新的加权算法,不再依靠Kalman滤波器和贝叶斯后验概率公式,而是直接依据各个“局部”模型的在线“表现”(即模型输出误差)来计算权值,基本上克服了经典加权算法的一些缺点,其简单结构如图4所示.图中,yr(t)为系统参考输入,w(t)为系统扰动.计算权值pi(t)的加权算法细节见文献[40],每个局部控制器Ki(s)针对其相应的局部模型按极点配置或鲁棒控制等方法进行设计.在此基础上,文献[41]在加权算法中迭代计算的快速收敛方面进行了改进,提高了加权算法的时效性.

图4 加权多模型自适应控制系统框图Fig.4 Block diagram for WMMAC

加权多模型自适应控制与基于T-S模型的模糊控制(采用并行补偿算法)相比,二者都是根据若干局部模型相应地设计多个控制器,而全局控制器则由各个局部控制器加权得到,但基于TS模型的模糊控制系统多一个隶属度函数的问题,而隶属度函数的最终目的只是为了确定加权值,相比较而言,新型的加权多模型自适应控制方法更为直接且便于实施;另一方面,由于其采用的加权算法是根据每个模型“在线”表现的优劣来决定相应控制器的权重,故而有理由相信这样得到的权重值比基于T-S模型的模糊控制中依靠“离线”方法确定的隶属度函数计算出来的权重值更加准确.当然,还应该指出,模糊控制的权重计算不是递推的,对于被控对象的参数突变,其反应更快,并且避免了权值重置问题.因此,对于参数慢变且有随机噪声的控制问题,加权多模型自适应控制较为适宜,而对于参数快变且噪声干扰较小或没有噪声的控制问题,切换多模型控制或者模糊控制更为合适.

(3)稳定性分析.

加权多模型自适应控制系统的全闭环稳定性分析一直以来是研究的难题.近些年来,该问题取得了一定的进展,文献[72]针对离散时间随机系统,基于引入“驻留”时间的加权算法,取得了一些初步的稳定性结果.但由于其策略的修改,使得系统整体结构已发生改变.此外,文献[24−25]针对采用模糊融合方法的多模型自适应控制系统,分析了稳定性,文献[38]给出了关于在参数估计层面上进行加权的控制系统的闭环稳定性结果,但都从某方面改变了原始的加权多模型自适应控制系统结构,而原始系统的闭环稳定性问题一直悬而未决.

最近,通过设计新的加权算法,并且采用一种新的自适应控制系统分析方法——虚拟等价系统方法,取得了一些成果.虚拟等价系统是一种输入输出意义上与原系统等价的系统,将非线性主导(结构非线性)问题转化为线性主导(结构线性,补偿信号非线性).该方法最初在分析自校正控制系统的稳定性[73−75]中提出,后来也在切换型多模型控制的系统分析中获得满意结果[76].文献[40]首次给出了加权多模型自适应控制的稳定性证明(针对线性时不变离散随机被控对象),随后,又不断在各个方面对文献[40]的结果进行了扩展,包括加权算法改进[41],被控对象范围扩大[42−44](参数跳变系统,连续系统,有色噪声系统,非精确建模系统等).鉴于其中的加权多模型自适应控制仅是针对模型集由固定模型构成的情形,当模型集中不包含真实被控对象模型时,该控制系统的性能则有待提高.因此,通过构建含有自校正模型的加权多模型自适应控制系统[77],放宽了对模型集构建形式的约束,扩大了保证系统稳定性、收敛性的理论适用范围,从而为加权多模型控制的稳定性分析提供了统一框架下的方法.

4 总结与展望

本文主要梳理了加权多模型自适应控制的发展历程和研究现状,概述了模型集构建、加权算法以及稳定性分析的工作进展.考虑多模型系统涉及内容太过广泛和作者研究工作的兴趣方向,综述内容难免不全面.对于加权多模型自适应控制而言,虽然已经取得了不少研究成果,尤其是初步给出了全闭环系统的稳定性证明,但是仍然有很多问题需要进一步解决.该领域未来研究方向包括以下几个方面:

(1)模型集问题.现有针对模型集构建的研究成果中,若系统模型不确定参数向量是高维的且系统性能要求比较高,则模型数量会很大,造成系统的冗杂,难以满足系统的期望性能和实用性.比如,文献[1]采用依据性能指标相对于非自适应控制系统的改进程度(百分比)来确定模型数量,而文献[62]采用了Vinnicombe测度[78]来决定模型数量.如何设计适当准则合理地构建精确模型集,是系统研究的难点所在,对提高系统性能、降低运行成本有着广阔的研究前景.

(2)权值计算问题.当权值收敛以后,若系统发生变化,需要重置加权值,那么如何保证权值的重置既简单快速又准确无误,有待进一步研究;另外一种方法是设置权值的“死区”,即当权值达到某个阈值时,保持权值不变,避免权值重置,但是阈值的设置也缺乏相应的理论指导.如何科学设计快速准确的加权算法,使其满足控制性能要求,对完善系统理论有着重要的现实意义.

(3)抗干扰问题.虽然文献[40−41]等给出的最新加权算法有比较好的抗噪声能力,但是从本质上说,在算法所依据的指标函数中还是不可避免的引入了噪声干扰,影响系统性能.如何设计简单有效的指标函数乃至加权算法,对系统的实用性有着重要意义.

(4)稳定性问题.现有稳定性研究结果并不完善,需要扩展到时变非线性被控对象、多变量被控对象以及上述对象中含有一般噪声的情形,诸多问题尚未解决,是未来研究的重点难点所在.

猜你喜欢
适应控制权值局部
一种融合时间权值和用户行为序列的电影推荐模型
基于事件触发的船舶航向逻辑切换自适应控制
局部分解 巧妙求值
爨体兰亭集序(局部)
非局部AB-NLS方程的双线性Bäcklund和Darboux变换与非线性波
CONTENTS
含齿隙弹载舵机的全局反步模糊自适应控制
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
局部遮光器