战斗机行为模式序列统计技术

2015-03-11 03:24
舰船电子工程 2015年7期
关键词:敌方数据挖掘概率

陈 辞

(海军驻426厂军代室 大连 116001)



战斗机行为模式序列统计技术

陈 辞

(海军驻426厂军代室 大连 116001)

特定的战斗机通常执行特定的作战任务,在特定的时刻表现出特定的行为模式,并执行由特定行为模式顺序构成的行为模式序列,这些行为模式序列可以用于对战场态势分析及目标意图识别的依据。论文基于数据挖掘中经典的Apriori算法,从目标行为序列记录中进行搜索和分析,找出符合条件的行为模式子序列,并以实例说明了统计的方法和过程。

序列模式; 战场态势; 数据挖掘; 序列统计

Class Number V271.4

1 引言

21世纪的战争是信息化的战争,信息化战争要求指挥员能够充分利用可以获得的各种信息资源,结合一定的战术知识,对战场态势做出迅速、正确的分析和理解。目前,战场态势分析所用的知识主要来源于专家经验,这些经验对于态势分析有一定的指导意义,但远不能满足实战中态势分析的需要,这就要求利用其它方法和手段获取更多的知识。数据挖掘技术就是获取战场经验和知识的一种行之有效的工具。充分利用数据挖掘技术相关理论模型,可以从海量的战场态势要素信息中找出潜在的逻辑关联关系,从而应用于战场态势的分析和作战决策的辅助制定。

数据挖掘[1]指从大量的、不完全的、有噪声的、模糊的以及随机的实际数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的知识的过程,也称数据集合中的知识发现。数据挖掘(DataMining)技术起源于20世纪90年代,它是一个多学科交叉研究领域,涉及到数据库(Database)技术、人工智能(ArtificialIntelligence)、机器学习(MachineLearning)、统计学(Statistics)、知识工程(KnowledgeEngineering)、面向对象方法(Object-OrientedMethod)、信息检索(InformationRetrieval)、高性能计算(High-PerformanceComputing)以及数据可视化(DataVisualization)等最新技术的研究成果[2]。典型的数据模式挖掘算法一般包括分类分析、聚类分析、关联分析以及时序分析等[3~5]。例如关联分析是指分析事件属性之间的关联关系,目的是得出事件属性间的规律性,关联规则挖掘技术用于发现数据中属性之间形如“A⟹B”的蕴涵式联系。商品销售分析中啤酒与尿不湿的关联关系发现正是关联分析的典型应用成果。

关联挖掘理论及相关算法被在作战指挥控制系统中的应用,实现了对战场态势要素之间关联规律的分析和提取,为指挥员的决策分析提供了智能化、自动化的辅助手段,提高了系统的智能化程度及决策的科学性和时效性。例如用基于知识发现的模糊专家系统、遗传算法来完成部队的兵力区分、战术编组、战斗队形配置等辅助决策,用关联算法、统计决策理论和基于知识发现的模糊专家系统等技术确定敌人的主攻方向,确定目标的重要程度和打击顺序,进而进行威胁分析等等。文献[6]提出了一种通过关联规则算法对已有目标活动数据进行数据挖掘的方法,并详细描述了数据挖掘技术在情报处理中应用的体系结构和实现方式。文献[7]对数据挖掘的概念、过程及应用前景以及指挥挖掘系统中涉及的数据挖掘方法进行了论述。

在战场态势分析中,敌方作战计划的推理识别是当前一个研究热点,它对应于人工智能领域中的规划识别[8],是指根据Agent的行为序列推断Agent所追求的目标的过程,即根据观察到的片断、琐碎的现象,推出具有合理因果关系的完整的、全面的计划描述。该定义在军事领域中由于特指识别敌方的计划,故称为“计划识别”。为了实现对敌方作战计划的推理识别,敌方兵力的行为序列是一种重要的模式规律,对于以作战计划识别为代表的战场态势分析应用中,行为序列模式更是一种必不可少的作战计划推理识别背景知识。因为由计划识别的定义可知,推理敌方的作战计划,必须先验性的知道敌方的行为序列模式和当前行为片断,而这个行为序列模式的获取,最理想的手段就是对敌方的作战行为进行分析和挖掘,运用相关理论统计出来。

2 序列模式分析

2.1 贝叶斯网络模型

BN模型是1986年美国加州大学Pearl教授将贝叶斯理论和图模型有机结合提出来的一种有向无环的概率网络模型[9],因其严密的数学逻辑表达能力和因果概率推理能力而受到广泛关注和应用。一个BN模型包括一个节点集,一个有向边集和一个概率分布关系描述集。节点集中每个元素表示一个逻辑事件,有向边集中每个元素表示两个逻辑事件之间的有向逻辑关系,概率分布关系描述集中每个元素表示一组逻辑关系的概率依赖分布。在BN模型描述的事件关系中,每个事件节点的状态概率受到与之相关的父节点和子节点状态概率的影响,因此理论上,可以根据对应的概率依赖关系由其父节点和子节点状态对该节点状态概率进行推理和确定。节点状态概率的计算方法为

Bel(X)=αp(X|Parent(X))p(Children(X)|X)=απλ

其中,p(X|Parent(X))为父节点对该节点的因果信息,用π表示;p(Children(X)|X)为子节点对该节点的诊断信息,用λ表示,α为归一化计算因子。

2.2 行为序列模式

事实上,对于特定的作战目标,受限于其自身的物理性能和作战特点,其行为分量表现出一些相对稳定的取值状态。例如,图1所示为舰载战斗机执行炸弹空袭任务时典型的高度剖面图。显然,在不同的空袭的过程中,战斗机飞行的几个阶段一般都有相对固定的高度,形成与行为模式对应的高度模式特征。

图1 战斗机突袭高度剖面图

类似的,作战目标的速度、高度、加速度、电磁辐射等特征相应也表现出一定的模式特征。这些模式特征的组合,形成该作战目标的若干种作战行为模式。而战场中作战目标在遂行特定的作战任务时,其行为序列模式是按一定的规律被顺序执行的。形成其特有的行为模式序列。

3 算法设计

序列分析是指统计和分析事件之间的先后序列关系,目的是发现事件间的时序和因果关系,进而转化成琐碎事件的组合规则。主要是对大规模的具有时间先后特征的数据库进行分析,从中发现出感兴趣的或有用的规则、规律等。Han J.W.在文献[1]中对序列模式的挖掘进行了较为全面的论述。当前,几乎所有的序列统计算法都是基于Agrawal等提出的Apriori算法[10]发展而来。序列模式挖掘首先需要明确几个概念:

· 记录库(Transaction Database):存储着二维结构的记录集,定义为D;

· 记录(Transaction):在记录库中的一条记录,定义为T且T∈D;

· 项集(Itemset):序列出现的项的集合,定义为K-itemset(K项集),K-itemset∈T,一般K表示项数;

· 支持度(Support):定义为Sup(X)=occur(X)/count(D)=p(X);

· 候选集(Candidateitemset):通过向下合并得出的项集,定义为C[k];

· 频繁集(Frequentitemset):支持度不小于最小支持度的项集,定义为L[k]。显然,频繁集的子集必为频繁集。

以Apriori算法为基础的各序列模式统计挖掘算法的基本思想是先读入数据记录集及最小支持度(min_sup)值,然后从单条记录开始,扫描记录集,搜索满足最小支持度要求的单项集合,然后按照递归的思想,依次在上一步搜索结果基础上,搜索满足最小支持度要求的长度增1的项目序列,直到搜索结果集合为空为止。最后得到的项目子序列集合中的元素就是从给定数据记录中统计得出的满足支持度要求的序列模式。序列模式统计挖掘的含义是从给定的记录库中找出以最小支持度为统计概率出现的元素子序列,反映了以整体为单位的元素序列模式。

因为是通过序列统计来分析敌方目标的行为模式,进而进行战术意图识别,显然序列统计分析的对象应该是目标的行为。也就是说,序列统计分析和目的是挖掘敌方目标行为的序列模式,得出其行为序列模式。然而在战场上,作为非合作目标,敌方目标的行为是无法直接获得的,需要由多方面的属性特征综合分析推理得到。即首先由探测获取得到目标不同侧面的状态数据计算目标处于哪种特定的行为,进而对按时间产生的行为进行序列分析,得出该类目标的行为模式序列。

算法分为两个步骤:第一步,建立行为与特征的关系BN模型,根据不同时刻的目标特征计算目标对应的行为置信度,按照最大概率置信其行为状态并依时间顺序形成行为状态序列,由若干行为状态记录形成的记录库D;第二步,运用序列统计方法进行记录库模式挖掘,扫描行为记录库,根据给定的最小支持度值统计出该目标的行为模式K-itemset。

图2 目标行为推理BN模型图及序列统计Apriori算法

第一步中基于目标特征来推理行为是典型的逆向推理过程,根据BN推理的计算公式Bel(x)=απλ进行计算,式中π为外部环境对目标行为的因果信息,λ为目标特征对行为推理的诊断信息,α为归一化因子。因为该BN模型反映的是目标各行为下相应特征状态,因此中模型中没有考虑环境信息,计算式简化为Bel(x)=αλ,即Bel(目标行为)=αPr(目标行为)λ,其中Pr(目标行为)为目标行为的先验信息,在通常情况下,可以认为目标行为在其若干值域内先验等概率。

第二步是基于时序下推理得到的行为序列记录运用Apriori算法进行统计分析,从数据集中得到该目标的行为模式规律,依此可以实现对该目标的行为预测,用于战场态势分析和推理。

4 算法实验验证

以空中目标行为模式为例说明本文序列统计方法过程:按照文献[11]中的例子,假设敌方空中目标的行为划分为七种,分别用M1~M7表示,各行为的表征及与行为之间按一定的概率分布关系确定,其中高度状态空间为{4.2,>10,<1,6~10},单位为km;速度状态空间为{1000~1200,1200~1800},单位为km/h;距离状态空间为{<135,>135},单位为km;电磁信号状态空间为{有,无}:

假如某时刻有一批目标距离我方270km,高度4200m,速度800km/h,未明确检测到电磁辐射信号,对这四个特征状态进行概率空间映射得到高度向量为[1,0,0,0],速度向量为[1,0],距离向量为[1,0],电磁信号向量为[0.5,0.5],则根据给定的概率分布关系进行该目标当前行为计算得到目标为中空巡航的概率为

Bel(M1)=αPr(action)λ

=Pr(action)p(h,sp,s,em|M1)/p(h,sp,s,em)

=(1/7×0.8×0.8×0.9×(0.5×0.5+0.5×0.5))

/(1/4×1/2×1/2×1)=0.65

类似的计算出其它几种行为的概率,得到行为概率向量为[0.65,0.16,0.14,0.01,0.01,0.02,0]。因此根据可能性判定该目标当前行为是M1。同样的方法对若干时刻目标的行为进行推理分析,可以得到目标历史行为记录库。假设根据历史数据计算得到目标行为序列记录如表1所示。

假定设定最小支持度为20%,采用Apriori算法来统计分析表1中的若干条记录,统计得到M1M2M5和M2M4M7两个序列分别有25%的支持度,这两个序列为当前目标行为记录库中的最大频繁子序列。也就是说,该敌方空中目标具有[中空巡航→中空加速巡航→高空电磁徘徊]和[中空加速巡航→超高空徘徊→超高空徘徊]两种行为模式。统计的结果正与实际情况一致:第一种行为模式可以看作到达目标区域上空施放电磁干扰的过程,第二种行为模式可以看作突击进入目标区域后择机进行俯冲佯动的过程。

表1 目标行为记录表

通过BN模型和序列统计方法得到战场目标运动行为的模式规律后可以以该规则库为依据进行战场上敌方目标战术意图的推理和分析,例如发现敌方空中目标经历了中空巡航和中空加速巡航后,根据相应目标的统计行为模式,有理由认为该目标可以以一定的信度进行电磁干扰施放,且接下来该目标可能作高空电磁徘徊动作。

5 结语

本文提出对敌方目标的行为序列进行分析和统计来建立敌方目标行为序列模式的规则的思路,并采用了先建立和通过BN模型通过目标状态对目标行为进行概率计算,然后利用Apriori算法进行统计以得到敌方目标行为的序列模式的方法。实验证明该思路可以用于抽取目标行为模式,为进行相应战场态势分析和战术意图推理提供了分析依据。

[1] Han J W, Micheline K. Data Mining: Concepts and Techniques[M].北京:机械工业出版社,2001.

[2] Mao G. J.数据挖掘技术与关联规则挖掘算法研究[D].北京:北京工业大学博士学位论文,2003.

[3] Chun-Wei LIN, Tzung-Pei HONG, Wen-Hsiang LU. Using the Structure of Prelarge Trees to Incrementally Mine Frequent Itemsets. New Generation Computing,2010:5-20.

[4] Agrawal R, Srikant R. Fast algorithms for mining association rules[C]//Proceedings of the 20th International Conference on Very large Databases. Santiago: Morgan Kaufmann,1994:487-499.

[5] Agrawal R, Shafer J C. Parallel mining of association rules[J]. IEEE Transaction on Knowledge and Data Engineering,1996,8(6):962-969.

[6] Yuan J. S., Li X. H. Application of Data Mining Technology in Information Processing[J]. Radio Engineering,2008,38(2):29-31.

[7] Zheng H. T., Qian P. H. Data Miningin Command and Control System[J]. Fire Control & Command Control,2004,29:59-61.

[8] SCHMID C F, SRIDHARAN. The Plan Recognition Problem: An Intersection of Psychology and Artificial Intelligence[J]. AI,1978(11):45-83.

[9] Pearl J. Fusion, propagation and structuring in belief networks[J]. Artificial Intelligence,1986,29(3):241-288.

[10] Agrawal R, Shafer J C. Parallel mining of association rules[J]. IEEE Transaction on Knowledge and Data Engineering,1996,8(6):962-969.

[11] Ge S, Xia X Z. Dynamic series BN used for recognition of tactical intention[J]. Systems Engineering and Electronics,2014,36(1):76-83.

Study of Aircraft Target Behavior Sequence Statistics

CHEN Ci

(Navy Force Representative Bueau in 426 Factory, Dalian 116001)

Special aircraft target usually executes special tasks. It acts as special behavior mode at some special time, and forms special behavior mode sequences, which may be used for battlefield situation evaluation and target intention recognition. Based on classical Apriori algorithm of data mining theory, the paper studies the way to find some special behavior mode sequences from behavior records of special target, and shows the processes of the model with instance.

series model, battle-field situation, data mining, sequence statistics

2015年1月5日,

2015年2月27日 作者简介:陈辞,男,硕士,工程师,研究方向:自动控制与系统集成。

V271.4

10.3969/j.issn1672-9730.2015.07.017

猜你喜欢
敌方数据挖掘概率
少林韦陀十八手
改进支持向量机在特征数据挖掘中的智能应用
第6讲 “统计与概率”复习精讲
4打5,敌方还剩几个人?
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
水果大作战