一种基于多Agent 系统的协同竞技模型

2013-10-21 00:53王秋茸
电子设计工程 2013年12期
关键词:实例竞技协同

王秋茸

(西安体育学院 网络管理中心,陕西 西安 710068)

现代竞技体育对博弈论已经有了相当的重视,中国最早的博弈论可以追溯到战国时期的“田忌赛马”,甚至如今仍然成为一个竞速模型而被发扬,比如就有基于“田忌赛马”的博弈模型研究竞速机器人比赛的决策问题的实例[1]。1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。从理论上来说,博弈论是研究相互依赖、相互影响的主体理性决策行为以及这些决策的均衡结果理论,互为依赖并且相互影响的决策行为及其结果的组合则被称为博弈[1]。博弈论是信息科学研究的一个重要方向,对于竞技中的博弈现象通过抽象可以建立较为完备的逻辑体系。在现代竞技中,由于体系规模对垒的出现,不但需要立足于博弈论,更需要重视平台内部主体间的协同。

朴素的古希腊文明指出协同是关于合作的科学。亚里士多德用“整体大于部分之和”的论断评价了协同的重要意义,时至今日,这一观点仍在社会生活中受到人们的普遍认可和重视,系统科学研究领域“新三论”中德国理论物理学家Hermann Haken 提出的协同学更是把协同的研究作为一门专门的学科来指导生产实践。现代体育中,竞技体育是一项协同运动,尤其是以体系对垒的竞技体育中存在大量的战术协同,包括活动协同与信息协同,体现了开放系统的一种涌现现象。比如篮球、棒球等球类比赛,个体能力再强,也无法单独取得比赛的胜利,只有全队间的协作配合,才能有取胜的可能。因此在进攻时,击球员不能只为自己考虑才如何击球,而要从全队的利益出发考虑应如何击球,如果本队在垒上有跑垒员的话,就要想到那个跑垒员怎样能进到下一垒,或者是怎样才能让他得分等。这些问题的思考与解决的过程正是一个协同工程的实施。而这些理论的应用与表达在实际中经验成分较多,科学的信息模型较为欠缺,信息技术的发展使得仿真这些战术协同具备可行性,文中旨在通过提出一个一般的竞技体育的协同模型来解决平台博弈中的多主体竞技中的协同战术模拟。

1 体育竞技中的协同

体育竞技中存在着若干协同关系,基本分为角色联盟与角色平台,即可以是角色内(同一角色不同主体之间)协同、角色间(不同角色主体之间)协同。

1.1 协同竞技

在军事学中,现代战争必须贯彻的原则之一就是“协同作战”,实际上协同竞技更像是协同作战的训练和实验。协同可以分为相同主体间的协同和不同主体间的协同。如在体育竞技中有担任赛场的同一角色不同主体间的协同,以及不同角色之间的协同。同一角色的不同主体可以通过协同形成技术联盟以更强大的执行力完成一个任务,而不同角色的不同主体通过协同形成互为补偿的综合执行平台来完成单个主体无法胜任的任务。

1.2 现代竞技体育是平台对平台的协同式博弈

现代系统论中的协同学说指出,开放系统在远离平衡态情形下,在一定条件的子系统间的相互作用和协作中,这种系统会形成有一定功能的自组织结构,在宏观上产生时间结构或空间结构,或者时间—空间结构,从而达到新的有序状态。现代体育竞技是一个开放系统,即使是单主体参与的比赛仍旧具有平台参与的特点,用于实施竞技前端的主体要受到若干后台主体甚至若干保障子系统的支撑。没有支撑子系统之间的良好协同,无法成功地完成一次竞技。比如一个竞技平台通常由运动员、教练员、替补、后勤保障等组成。

在现代运动训练体系的架构环境中,为满足专项竞技需要而逐步专项化的运动员机体,本身就是一个逐步远离自然平衡状态的多重复杂系统[2]。竞技平台的竞技能力由预备状态向目标状态转移的实现过程,毫无疑问地要紧密依赖于具有自组织功能的竞技团体和具有非平衡系统特性的运动训练体系内部多重子系统间的相互作用和协作。

2 多智能体的协同

如何基于平台实现灵活资源配置? 如何协同使用能力互补? 如何构成执行协同任务的“能力支持系统”? 这些是协同竞技关注的研究课题。

2.1 Agent 和MAS

智能体(Agent)是一个物理的或抽象的实体,它能作用于自身和环境,并能对环境做出反应。是一类在特定环境下能感知环境并能自治地运行的计算实体。它接受从环境中感知的信息,并产生相应的动作作用于环境,这种交互过程可以是一个循环连续的过程[3-4]。

智能体具有以下特性:

1)自治性,即智能体能在没有操作人员和其它智能体的影响控制的情形下,对特定环境做出响应,并根据感知的信息调整自己的状态和行为;

2)反应性,智能体不但可以通过感知信息对环境做出被动反应,而且可以根据自身的需求对环境主动做出动作,调整环境要素来适应自身更好的发展;

3)社会性,如同人是社会的成员一样,智能体也是众多智能体形成的交互社团的一员.它在自主运作的同时与外部环境和其它智能体交互协作,并可以积极协商消除冲突;

4)主动性,智能体在与环境和其它智能体的逐渐交互过程中具有学习能力,能不断更新自己的知识库,提高了环境适应能力和系统行为能力。

作为竞技主体的人可以跟智能体一一对应,比如眼睛、耳朵等作为传感器子系统,手、足、口及身体的其他部位作为执行器。因此通过Agent 可以模拟一个理性的主体。

通常Agent 在解决某一问题时,其能力是单一的,但若干个Agent 通过通信和协同,形成一个Agent 联盟或综合体,却可以解决非常复杂的问题,完成困难的任务。这种联盟或综合体就称其为多智能体系统。

多智能体系统MAS(multi-agent systems)是指由多个Agent 组成的一个较为松散的多Agent 联盟,这些Agent 成员之间相互协同,相互服务,共同完成一个任务。各Agent 成员的活动是自制和独立的,其自身的目标和行为不受其它Agent 成员的限制,它通过竞争或磋商等手段协调和解决各Agent 成员的目标和行为之间的矛盾和冲突。

2.2 基于角色网络(RN)理论的MAS 协同

在RN 理论中,角色是一系列职责和权力的集合,角色的职责定义了该角色的执行实体在实现某一目标时应进行的活动;角色的权力定义了角色的执行实体对哪些资源具有使用权限,即为了使其顺利完成任务系统需为其提供相关数据、知识、运行环境等。角色具有下述特征[4]:

1)职责规定性,角色的职责由一活动序列的执行来实现;

2)事件驱动性,角色可以接收来自其它角色或系统外部的事件,并进行相应处理有选择地做出应答;

3)业务描述性,业务通过角色之间的交互描述;

4)概念集合性,角色概念描述了一类参与者个体的行为,具有集合性;

5)个体独立性,角色是相互独立的,但他们之间通过交互进行通信。

将RN 理论与Agent 技术结合可以形成多Agent 协同业务流程。基于角色能够建立基于 RN 理论的业务流程(RNBP)模型,为了基于Role 技术建立Agent 协同业务流程ACBP 设计模型,需要建立RNBP 模型到Agent 协同网络模型的映射,包括角色与Agent 之间映射,以及角色属性与Agent 属性之间映射。该模型为建立具有柔性化自动化智能化的业务流程模型提供了一种有效方法。

3 基于多Agent 系统协同竞技

3.1 竞技平台的模型表示

在一个一般的体育竞技中,描述协同MAS 系统需要建立的Agent 可以分为情境感知Agent,决策Agent 和执行Agent。

实际操作中,在某些情形下,一个平台运作的竞技系统具备可重构性。基于以上观点可给出下面的Agent 模型。

一个角色Agent 可以表示用一个六元组表示为

其中:A 是Agent 的标识集合;S 是Agent 的内部状态;E是Agent 面临的外部环境,S 和E 构成Agent 推演和作动的基础;R 是Agent 能担任的角色集合;T 表示Agent 的计划,即面临的任务;K 是Agent 的知识系统,包括任务分解方法以及Agent 之间目标、意图和推理机制等的冲突消除。

平台竞技任务通常具备多种能力构成,一个平台任务T可以通过向量表示为

其中ci(1≤i≤n)为一个整数表示的值,代表任务的能力构成强度。

一个MAS 模型是一个二元组S=(UAR,T),其中UARi为MAS,T=(UCT)为协同任务,U为对象集合的论域,CT为任务能力域。

通过不同角色扮演,及对应知识系统,角色Agent 可以实例化为情境感知Agent、决策Agent 以及功能Agent。一个角色Agent 的S 可以表达实例Agent 的可调度能力构成,角色R 可以表达基本的能力需求,而T 则代表了当前情境下Agent 的作动序列。

对于实例化的Agent 状态表达可以通过能力构成来进行如下表达:

图1 竞技MAS 协同过程Fig.1 Collaborative process among sports MAS

其中:A 表示一个Agent 实例,ai(1≤i≤n)为一个布尔值表示的变量,代表Agent 的可用性情况。

竞技平台可以通过一个多Agent 系统来表示,从能力构成考虑,竞技平台可以表示为角色Agent 实例的线性表示。设系统智能体集为{A1/m1,A2/m2,…,Ax/mx},其中Ai为第i 种角色的智能体实例,mi为对应的拥有数目,i=1,2,…,x。那么S={L=λ1*A1,S+λ2*A2,S+…+λx,S}。在竞技任务执行的一个时刻,不同的配置坐标(λ1,λ2,…,λx)则代表了不同的多智能体配置(λ1,λ2,…,λx)。在一次竞技中,因为个别智能体的作用丧失,竞技平台可能会经历若干次重组。而好的重组算法会使得竞技平台在当前能力许可范围内总处于应对任务的最优化状态。

3.2 考虑代价的协同竞技重组

在平台运作中,如果出现Agent 实例发生功能障碍,则可以通过面向任务的系统重组产生一个新的竞技配置,从宏观角度上能够看到平台的暂歇。因为操作上要经历一个寻优的过程,即通过综合比较多个配置坐标,权衡得出最优化的一个。这个问题可以通过一个线性规划来表达。为了寻优,为平台重组引入一个代价函数Cp,设Agent 实例代价用函数向量表示为w=(w1,w2,…,wx),其中wi=fi(i),i=1,2,…,x。那么平台总竞技代价为:

则问题可以描述为:

约束条件:λi≤mi,i=1,2,…,x

对于线性规划标准型,若存在可行解,则必然存在一个基可行解;若存在一个最优可行解,则必然存在一个最优基可行解。令K 是满足约束条件的所有n 维向量X 所组成的凸多胞形,那么向量X为K 的一个极点的充分且必要条件是X为约束方程的基可行解。只要找到约束条件所组成的凸多胞形的极点,就可以从中找到最优解。关于问题求解过程则是另外一个命题,其本身与协同竞技相关性不大,这里通过图2 给出求解流程。

图2 求解的算法流程图Fig.2 The flow chart of resolving algorithm

4 结论

在多Agent 协同中,易出现过于灵活而可控制性不足的问题,为了提高MAS 系统的凝聚力和系统可控性,为竞技平台增加动态约束和调整系统行为的策略是必要的。通过引入政策导向型多Agent 协同可以用来增强系统的可控性。

在传统体育训练中,协同竞技的模拟手段通常受制于实际条件。文中引入信息科学中的研究方法针对平台体系对垒的体育竞技提出一种协同竞技模型,通过角色Agent 建立情境感知Agent、决策Agent 和功能Agent 实例组织的多Agent系统,形成综合竞技平台模型。弥补了传统经验体育中协同实验的不足。该模型可以用于评估竞技个体对整体的影响作用,辅助训练决策,以及竞技个体之间相互学习的能力结构调整引起的竞技平台演进。从而通过基于多Agent 的协同手段,为现代体育竞技训练培育综合竞技平台。

[1]杨萍,史小星,李尧.竞速机器人比赛的博弈策略研究[J].机械设计,2011,28(3):1-2,5.YANG Ping,SHI Xiao-xing,LI Yao.Research on game stratefies of robots’racing competition[J].Journal of Machiine Design,2011,28(3):1-2,5.

[2]张英波.体能主导类快速力量性项群运动员竞技能力状态转移的时空协同理论[J].体育科学,2000,20(4):24-28.ZHANG Ying-bo.The space-time synergy theory in the state transition of athlete’s competitive ability in speed-strength sports group[J].Sport Science,2000,20(4):24-28.

[3]陈志伟.基于Agent的协同开发体系[J].东北林业大学学报,2008,36(8):90-91.CHEN Zhi-wei.Cooperative development system based on agent[J].Journal of Northeast Forestry University,2008,36(8):90-91.

[4]刘继山,王延章.RN理论支持的多Agent协同业务流程建模[J].计算机应用与软件,2011,28(4):12-16.LIU Ji-shan,WANG Yan-zhang.Multi agent collaborative business processes modeling based on rntheory[J].ComputerApplications and Software,2011,28(4):12-16.

[5]胡军,李正通.政策导向型多agent 协同系统研究[J].计算机应用研究,2010,27(8):3009-3012,3015.HU Jun,LI Zheng-tong.Study on policy-oriented multi-agent cooperation system[J].Application Research of Computers,2010,27(8):3009-3012,3015.

[6]吕超,黄炎焱,迟少红,等.基于MAS的海军装备协同作战仿真模型[J].江苏科技大学学报:自然科学版,2010,24(3):273-277.LV Chao,HUANG Yan-yan,CHI Shao-hong,et al.Simulation model of naval equipment cooperative combat based on multi-agent system[J].Journal of Jiangsu University of Science and Technology:Natural Science Edition,2010,24(3):273-277.

[7]史德嘉,王璞.基于MAS协同的动态资源优化调度策略研究[J].计算机应用研究,2009,26(11):4063-4065.SHI De-jia,WANG Pu.Research on resource allocation algorithm based on MAS cooperative bidding game [J].Application Research of Computers,2009,26(11):4063-4065.

[8]夏庆军,张安,张耀中.战斗机编队协同作战效能评估研究[J].系统仿真学报,2010,22(9):2182-2184,2189.XIA Qing-jun,ZHANG An,ZHANG Yao-zhong.Study on effectiveness evaluation of fighter plane formation cooperative combat[J].Journal of System Simulation,2010,22(9):2182-2184,2189.

猜你喜欢
实例竞技协同
TSA在重竞技运动员体能测试中的应用
家校社协同育人 共赢美好未来
蜀道难:车与路的协同进化
竞技精神
“四化”协同才有出路
三医联动 协同创新
花与竞技少女
完形填空Ⅱ
完形填空Ⅰ
同台竞技