复杂环境下改进AGNES多智能体动态联盟算法

2022-01-22 10:46张曌宇韦道知

电光与控制 2022年1期

张曌宇，韦道知，李宁

(空军工程大学防空反导学院,西安 710000)

0 引言

在空、天、地、海防御一体化不断推进的进程中，战场环境下如何及时、精准地识别目标、掌控目标动态，是正确评估战场态势，赢得现代信息化战争的必要前提。面对战场复杂环境的传统单传感器任务过程更加容易受到干扰，从而恶化任务结果内部的模糊性，导致战场决策风险加大。就以上问题，本文主要研究多传感器联盟过程中通过相互交叉提示决策优化更新[1]。多源传感器动态联盟是在多传感器间交叉提示的基础上，引入动态联盟机制[2]。主要采取多传感器间交叉提示、相互印证、协同探测等手段，由多传感器从时段性、区域性、阶段性组建任务联盟以补全、细化目标信息，达到目标可连续探测目的，提高探测信息置信度与时效性。

目前，在国内外学者对多传感器动态联盟的研究中，文献[3-8]利用博弈论算法、改进多智能体群优化算法、基于协商机制对多传感器联盟分布探索并提出改进双方合同网和拍卖算法,以及分布式一致方法、任务分配方法、扩展合同法数学模型最优化等详细研究传感器联盟框架的组建与过渡机制[5-8]，却忽视复杂战场下环境给传感器任务带来的不确定因素，使多传感器联盟在稳定仿真实验环境下丧失对复杂环境的应变性，并且对于传感器交叉组网顺序也没有详细研究。上述讨论对多传感器在复杂环境下动态联盟模型的组建提供了良好的契机和思路。因此，本文主要研究的基于无监督学习方法下改进AGNES层次聚类算法的传感器动态联盟，首先，创新地提出在复杂环境下构建动态联盟模型，更新原有多传感器系统理论，针对性研究在复杂条件下当前传感器发现目标后下一步该如何动态调动传感器、组建传感器间的动态联盟系统、确定在复杂环境下的联盟组建条件；其次，运用改进的AGNES算法对模型进行最优化求解，最后，仿真进行分组实验来验证模型的可行性。

1 多传感器动态联盟模型构建

当有m个传感器(Agent)对目标j同时开展探测任务，当前量测方程为

(1)

当

(2)

于是有

Zk=HXk+Vk。

(3)

采用卡尔曼滤波对目标量测进行状态估计后的联合探测概率密度为pdj。

定义1建立联盟模型中探测概率，m号Agent对编号为j的目标探测的总概率可定义为：第i1(除i0之外)个传感器在复杂环境的影响下是否加入动态联盟对目标j进行共同探测的概率为pdj，联盟中,每加入或移除一个传感器都应增减相应的括号项。

(4)

定义2建立多传感器动态联盟对目标的探测最优化模型。

1) 多Agent对目标j的最大探测率P为

(5)

2) 联盟最小探测消耗Cmin为

(6)

3) 最短探测时间Tmin为

(7)

式中，ti j表示单个传感器i对目标j的探测时间。

复杂环境下，衡量Agent自身是否可以满足联盟任务需要，以及Agent如何进行工作评估，本文将复杂的动态联盟组建问题转化为：联盟对目标的最大探测精度、效能消耗最小、用时最短的3个方面建立最小化的最优数学模型函数f(P，C，T)

f=w1Pmax+w2Cmin+w3Tmin

(8)

式中，w1,w2,w3表示常数权重参数，且w1+w2+w3=1。

2 基于改进的AGNES无监督学习动态联盟

2.1 无监督聚类学习算法

聚类可以将原本复杂环境中产生的杂乱数据集按照潜在的规则进行无标记的训练学习，对数据的内在系统结构进行自我寻找，将具有相同特征的样本归为一类，如图1所示传统AGNES聚类算法按照距离进行聚类。

图1 AGNES聚类算法Fig.1 AGNES clustering algorithm

本文针对多传感器动态联盟在复杂环境问题中的模糊性特点，利用改进无监督学习方法中聚类算法，将传感器对目标构建的最优化目标函数代替距离函数成为新的AGNES聚类方法，并将改进的算法应用于多传感器动态联盟。相比于传统智能算法，改进算法使得传感器分层聚类的效果更加准确、合理，结论更加贴近现实情况，帮助预设联盟摆脱对仿真环境的依赖[9]。

2.2 多传感器基于AGNES改进算法的动态联盟

在复杂环境下，稳定持续跟踪运动目标的前提是获取目标的可靠探测信息，现实战场中存在的天气因素、目标的相互遮挡、多源干扰等情况，导致目标源信息探测精度不高，为了弥补探测信息的模糊性，采取多Agent进行交叉提示下的动态联盟，利用多Agent间信息的冗余性与互补性，补足整体探测信息，其结构如2所示。

图2 多智能体结构Fig.2 Multi-agent structure algorithm

将每个在初始未探测到目标的Agent，都设为一个初始簇{Il|l=0,1,2,3,…,n,…,m}。当在某一时刻t发现目标Agent提出响应，并以管理Agent身份开始着手进行联盟组建。针对不同目标，首先，管理Agent自身对目标探测结果作为第一样本数据进行记录。将被发现目标的运动信息和状态信息进行初步处理，预测其大致运动方向，对t+1时刻发现目标并响应的预测区域内Agent进行联盟邀请，发布任务需求提供给响应的单个(或多个)Agent，并建立动态阈值M″imj[10]。其次，不断计算并更新数据点之间对目标探测信息的相似性度量将其作为工作传感器是否可以加入联盟申请进行评估，细化多Agent动态联盟在遇到目标在任务区域、环境突变等情况下保证不同传感器采集目标特征的认同度，即对同一任务中模糊度进行逆行标记，由于部分工作传感器样本属性被模糊干扰，存在影响结果精确度的可能性，于是将对不同Agent数据处理的模糊度即传感器对目标探测的认知程度评估结果定义为w:θ→(0,1)。并且将算法中的阈值Mimj″定义为在复杂环境下单一Agent样本属性的离散因子加权平均值的一致性函数[11-13]，以消化在复杂环境下多源Agent接收到的多样性模糊数据，补充动态阈值跟随联盟的不断更新而更新，结合联盟的样本属性确保新的工作Agent加入后不会降低联盟探测识别精度,从而提高探测信息的可靠性。

对发出联盟邀请的第i0号Agent和第im号Agent针对目标j探测样本属性的离散因子加权平均值的一致性函数模型构造一致性函数，即

(9)

根据式(9)得到的多Agent之间认同度的一致性函数，构建多Agent动态联盟对目标的一致性矩阵，即

(10)

利用式(10)的动态联盟对目标j识别的模糊度一致性矩阵，计算平均一致性，对函数进行归一化处理，可以得到联盟对目标探测的一致性函数，即动态阈值M″i0imj

(11)

式中,Mi0imj″代表第i0号与第im号Agent对目标识别一致性函数的平均值。

将联盟组建初始响应Agent的目标函数作为阈值初始值Mi0j″。根据动态阈值Mi0j″，Agent接到任务后，结合自身情况(minfim)和提出任务的管理传感器或联盟计算的阈值与原阈值进行比对。若小于原阈值，则当前阈值代替原阈值成为下一时刻联盟的新阈值，工作Agent可以加入联盟进行组建，形成新簇In(n

(12)

新簇I0h的出现可视为联盟成功组成，再进入下一时刻的探测进行任务发布，分别对提出响应的Agent自身效能和当前阈值进行比较，选出其中探测率最高、消耗最小、探测时间最短的Agent加入联盟，对上一时刻的聚类学习样本进行学习更新。训练多次后，管理Agent将在工作中不断进行误差修复和选择更优的Agent加入联盟，动态优化整体联盟工作能力，提高战场利用率以及探测精度[19]。

改进AGNES算法：

输入：样本集:D={P,C,T}

聚类簇距离度量f

聚类簇数i

聚类阈值Mi0j″

过程：1:fori=1,2,3,…,mdo

2:{Il|l=0,1,2,3,…,n,…,m}

3:end for

4:forfi0=Mi0j″

5:whileh

6:找出满足任务条件的新簇Ih

7:合并I0和Ih，Ih=I0∪Ih

8:Mi0ihj″=davg(fi0,fih)

9:end while

10:end for。

3 实验分析

演习空间中，待组网备选Agent特性如表1所示，目标运动航迹如图3所示，区域内有7个各不相同的Agent部署及位置。

表1 传感器位置信息和效能指标Table 1 Position information and performance indexes of the Agents

图3 Agent联盟对单目标航迹探测三维示意图Fig.3 Three-dimensional diagram of single-target track detection by agent alliance

加入高斯白噪声模拟复杂环境，分别对单、多目标进行探测。联盟组建的目标就是在最短时间对不同数量目标完成探测。表1为7个Agent的效能指标。

每个传感器对不同目标的探测概率为

3.1 联盟对单目标探测仿真结果

从1号Agent首先进行探测响应，并对由7个定点Agent组建的聚类动态联盟进行任务训练，图4、图5分别给出动态联盟分别对单目标和多目标Agent具体响应步骤，仿真树状结果图表示部署顺序。

图4 改进聚类算法多传感器聚类结果Fig.4 Multi-agent clustering results of the improved clustering algorithm

由图4可知，使用本文模型构建方法对Agent进行预选调度，在第1时刻1号Agent首先发现目标，依次经过6号、3号、4号、7号、2号Agent到最后聚合5号Agent组成对单一目标完成探测的动态联盟，联盟函数值为2.581 6。

3.2 联盟对多目标探测仿真结果

类比单目标联盟效能，选取10个目标进行多Agent联盟聚类,图5为其响应示意图。

图5 针对多目标改进聚类算法多传感器探测聚类结果Fig.5 Clustering results of improved clustering algorithm for multi-target,multi-agent detection

在第1时刻,6号Agent首先发现目标，依次经过7号、5号、1号、3号、2号到最后聚合4号Agent组成对10个不同目标完成探测的动态联盟，联盟函数值为3.129 4。

再次对动态联盟中的探测率、消耗率进行效能评估。多Agent聚类探测效能趋势如图6所示。

图6 多Agent聚类探测效能趋势Fig.6 Detection efficiency trend of multi-agent clustering

由图6中7个Agent完成联盟组建后形成的联盟探测率为0.720 6，组建联盟对10个目标进行整体探测得到综合探测率为0.802，由于目标的个体差异，模型探测率最优在联盟对前9个目标进行探测，此时探测率为0.872 1，可以看出，随着Agent不断加入联盟，最终的综合探测率整体大于每个目标的单Agent探测概率，说明本文算法可以有效应用于Agent动态联盟，并能够补充单一Agent对目标探测过程的精度。

多目标下多Agent动态联盟探测消耗情况如图7所示。

图7 多目标下多Agent动态联盟探测消耗Fig.7 Consumption of multi-agent dynamic alliance for multi-target detection

在联盟探测消耗式(6)中取a=0.5,在图7可知，由于每个Agent对不同目标初始设定的消耗率不同，联盟探测的消耗率随Agent的先后加入消耗率也不同，但是都远小于单个Agent作业时对某一Agent的消耗率之和。在7个Agent对10个目标探测过程中的消耗率为0.313 9。

图8所示为多目标下联盟采用不同算法的效能对比。将本文模型结合不同多智能体算法(如改进粒子群算法[3]、博弈论算法[5]、扩展合同算法[6])与本文算法对联盟效能进行对比实验，由图8可明显看出不同算法下联盟效能结果,本文算法随着目标数量逐步增加具有效能更低、求解质量更优等特点。

图8 多目标下联盟采用不同算法效能对比Fig.8 Efficiency of different algorithms adopted by the alliance for multi-target detection

4 结论

本文主要研究多Agent动态联盟中如何提示、提示对象的问题，针对单目标和多目标不同情况下利用改进AGNES算法模型进行实验。并通过对Agent效能应用离散加权平均值的一致性函数确定动态阈值和在任务中标记未知信息，模拟在复杂环境中的联盟工作状态和环境，通过无标记地训练样本进行学习，来归纳总结以消除复杂环境下的模糊度。从而揭示数据的内在联系与本质规律，为下一步对数据预测、更新、分析提供强有力的依据。证明大型传感器(如认知雷达、卫星等[20])也能依靠经验积累，对复杂环境干扰下的目标动态进行预判，经过对经验不断地修正和积累，在复杂环境中做出更加有利的决策。本文首先介绍多Agent下的动态联盟模型，其次确定多Agent动态联盟条件，构架动态联盟的效能评估函数,最后对利用改进传统AGNES聚类算法进行动态联盟模型仿真实验验证。由结论可以看出，本文改进的算法可以满足对多Agent的聚类，并且通过对比在联盟模型中的不同算法对目标探测的应用,可以看出,本文算法具有良好的提高探测精度、更低消耗率、更高联盟效能的优点，对建立模型具有良好的求解质量，适合解决在战场资源珍贵、目标机动性不断增强，天气恶劣等复杂条件下对目标的连续探测问题。