大气环境剧情生成技术研究

2012-11-30 04:57赵黎明许丽人
计算机工程与设计 2012年3期
关键词:语义逻辑规则

蔡 军,赵黎明,许丽人,许 瑞

(1.天津大学 管理学院,天津300072;2.北京应用气象研究所,北京100029;3.中国科学院大气物理研究所大气边界层物理和大气化学国家重点实验室,北京100029;4.北京航空航天大学 自动化科学与电气工程学院,北京100191)

0 引 言

1995年10月,美国防部建模与仿真办公室颁布了 “国防部建模与仿真主计划 (MSMP)”,并将自然环境的及时和权威表示列为国防部建模与仿真发展的六大目标之一。为此,国防部组织实施大气和空间自然环境建模与仿真计划 (ASNE MSEA)。2000年,建模与仿真办公室公布了“整体自然环境 (INE)计划”,重点是提供自然环境的完整权威描述。这些计划的实施推动了仿真公共基础技术的迅速发展,如,动态大气环境标准、环境数据表示与交换规范 (SEDRIS)、总环境库 (MEL)、环境剧情生成 (ESG)、环境联邦 (EnvironFed)等。其中,环境剧情生成技术是对用户的特定环境信息需求做出及时回应,快速自动地生成满足用户需要的、且物理一致的大气环境综合剧情,并以标准规范的格式分发,以满足用户对特定区域、时间和环境条件下的仿真剧情的需求。当前,模拟训练、仿真分析和作战推演等对大气环境剧情提出了不同的需求,而不同的仿真剧情通常需要不同的大气环境状态或条件,基于当今先进数据收集系统不断扩充的数据量现状,以及仿真领域对于大气环境的集成和权威表达的需求,急需开展新的数据挖掘、管理和获取技术[1]。本研究面向仿真应用,基于模糊逻辑搜索原理实现了大气环境剧情生成技术。

1 剧情生成引擎框架

在大气环境剧情生成技术中,剧情生成引擎为其核心内容,它主要包括模糊逻辑搜索模块、剧情产品生成模块和大气环境剧情规则库3部分,如图1所示。

图1 大气环境剧情生成引擎框架

大气环境数据库为大气环境剧情生成提供了底层数据源支持,是剧情生成进行的基础。通过设计大气环境数据表结构,可以存储站点数据或格点数据。大气环境数据库虽然不归入剧情生成引擎框架中,但却是大气环境剧情生成不可或缺的部分。内部数据越充分,剧情生成引擎搜索到用户需求数据的可能性越大[2]。

模糊逻辑搜索模块是整个引擎的核心,其功能是根据用户提出的基于人类语言的搜索条件,从大气环境数据库中提取数据,利用模糊逻辑算法计算数据记录的符合度并排序,得到候选事件列表供用户选择[3]。

大气环境剧情规则库由两部分组成:剧情语义规则、剧情物理规则库。分别为模糊逻辑搜索提供相应的语义规范和物理规则。

剧情产品生成模块负责剧情数据的后处理。主要包括剧情数据集的表示、剧情数据的可视化、数据文件的生成等一系列的数据处理功能。

用户进行剧情组织后,模糊逻辑搜索引擎对大气环境数据库中的数据进行搜索。大气环境剧情规则库对模糊逻辑搜索中的人类语言条件进行映射,支持模糊逻辑搜索。搜索到的数据集经过用户选择后进行数据产品的生成。由以上各部分协同工作,使大气环境剧情生成引擎能够支持自然语言对大气环境条件和大气环境信息描述;基于模糊逻辑的高效数据挖掘和挖掘结果评估;满足物理一致性需求的大气环境剧情组织。为用户使用提供合理、准确、规范的大气环境剧情产品[4]。

2 模糊逻辑搜索

大气环境剧情生成技术为用户提供了一种基于人类语言的剧情组织方法,使用户可以用更为直观的语言来设置搜索条件。但对于搜索引擎来说则需要在人类语言与计算机系统之间建立映射,这就涉及到模糊逻辑搜索。

2.1 模糊逻辑搜索原理

用带有模糊限定算子 (例如:很,略,比较,非常等)的从人类语言提炼出来的语言变量 (例如:年轻,非常年轻等)或者模糊数 (例如,大约25,45左右等)来代替多值逻辑中命题的确切数字真值,就构成模糊语言逻辑,简称模糊逻辑。它为诸如人类语言变量一类的模糊信息的描述和处理提供了理论基础。

在传统型对象空间X中的一个集合A的隶属关系可以用指标函数IA(.):X→ {0,1}来表示[5]。对象空间中的元素对于A的隶属度非0则1。如图2为段 [5,8]在实数空间R上的指标函数I[5,8]:R→ {0,1}。

图2 传统集合 [5,8]的指标函数

对于人类语言来说,描述一个元素是否属于某个区间时却无法用明确的0和1来定义,此时就需要使用模糊集来定义。模糊集衡量元素对集合的隶属度时指标函数值允许取在0、1之间。对象空间X中的一个模糊集合A通过隶属度函数μA(.):X→ {0,1}来定义。X中的每一个元素对集合A的隶属度都在0、1之间。如图3所示为模糊集合[5,8]的隶属度函数。

图3 模糊集合 [5,8]的隶属度函数

对二元模糊集合的隶属度函数进行逻辑操作可以由普通二元集合的指标函数逻辑操作进行推广[6]。如两个一维模糊集合隶属度函数μA(X),μB(X)进行与 (AND)操作后的隶属度函数为min(μA,μB);或 (OR)操作后的隶属度函数为 max(μA,μB);非 (NOT)操作后的隶属度函数为示例如图4所示。

图4 二元模糊集合的与、或、非操作

在大气环境剧情中,使用人类语言去描述大气属性,比如温度采用 “热”、“冷”、“适中”等来区分。这样的区间即可以用模糊集合来表示,它的隶属度函数则根据气象学的规范或是专家经验来确定。本研究实例的隶属度函数的确定使用generic bell方程[7]

式中:——数据变量的范围[0,1],a——半宽,b/2a——斜率,c—— “bell”的对称中心。

以大气环境中的温度属性为例,它的模糊集有 “寒冷”、“凉爽”、“适中”、“温暖”、“酷热”,它的隶属度函数参数表如表1所示。

表1 温度语言变量隶属度参数

对不同的大气环境属性,根据专业知识进行分析设定相应参数,即可在模糊搜索中使用g-bell隶属度函数对数据进行分析,确定数据对环境变量的隶属程度。

2.2 模糊逻辑搜索机制

大气环境剧情过程基于模糊逻辑搜索原理而实现,同时也对它的应用进行了拓展。用户对剧情进行组织,确定需要进行搜索的大气属性。对于单点,它的每一种大气属性值相对于搜索条件都有一个介于0和1的隶属度,也就是模糊搜索算法的判断依据。单点在时间序列上的隶属度采用平均算法

式中:ti=t0+iΔt。

对于时间固定,多点隶属度的计算可采用同样的算法进行计算。

以上3种基本情况的组合可以完成环境剧情中产生的所有隶属度计算,模糊逻辑搜索即建立在此基础上。

为提高模糊逻辑搜索效率,针对不同的搜索需求,数据集的划分也采用不同的方法[8-9]。本研究在剧情组织中提供了 “固定空间区域搜索满足时间剧情的时间段”和 “固定时间区域搜索满足时间剧情的空间域”两种搜索方式。因此对于数据段落的划分主要在时间维上和空间经纬度两个维度上进行分块,搜索过程中对单块数据逐一进行隶属度计算。分块的大小则取决于用户对搜索区域的设置。

一般情况下,很难在大气环境数据库中搜索到完全符合用户剧情设置的数据,仿真系统考虑到仿真的可信度也并非需要完全满足设置的大气数据。这也正是环境剧情使用基于人类语言的方式进行组织的主要原因。通过在模糊搜索过程中计算每个数据集的模糊隶属度值。最后通过比较排序,提取符合度比较靠前的数据集,存入候选事件列表反馈给剧情用户。用户即可依据经验判断搜索到的数据集是否可用。

2.3 模糊逻辑搜索步骤

模糊逻辑的搜索步骤参考了数据挖掘的原理[10],如图5所示。

图5 模糊逻辑搜索数据流程

数据预处理:根据用户的剧情范围设置,从大气环境数据库中查询相应的数据。同时根据用户的剧情条件设置对数据进行分块操作,产生数据集用于进行模糊逻辑隶属度计算。

数据集隶属度计算:使用g-bell函数对数据集进行各项属性隶属度计算,再计算出整个数据集隶属度。

数据集排序:对经过模糊逻辑运算的数据集进行隶属度排序。更新候选事件列表。

更新数据集:在数据预处理过程中是根据用户剧情设置对数据进行矩形划分生成数据集的。但实际情况中有可能出现两个数据集边界区域的隶属度很高,从两个数据集分别的隶属度上却体现不出来。这里对经过排序的数据集进行分析,抛掉隶属度为0的数据集。对隶属度较高,同时有接触的数据集进行重新划分计算隶属度,提高模糊逻辑搜索的准确性。

3 大气环境剧情规则

模糊逻辑搜索的关键技术之一为隶属度函数的确定,但人类语言变量针对不同的大气环境属性描述的也不尽相同,因此无法确定一个固定的隶属度函数以适应所有的搜索情况。大气环境剧情规则库可以让具有专业知识的管理员用户对语言变量进行参数设置,使模糊逻辑搜索引擎动态的建立隶属度函数。大气环境剧情规则库包括剧情语义规则库和剧情物理规则库[11]本文采用XML建立大气环境剧情的规则库,使想定生成引擎可以方便、快速的对剧情语义规则进行查询[12]。

3.1 剧情语义规则

在剧情组织过程中,用户设置一般是通过温度 “凉爽”,南风 “弱”之类的人类语言组织起来的。模糊搜索引擎在执行搜索之前首先需要将这些人类语言转换成数学描述语言才能进行下一步的工作。也即是需要一个规则集能够将人类语言映射成隶属度函数,这就是剧情语义规则库。

根据模糊逻辑模型g-bell建立的隶属度函数,需要每一个大气属性提供几个关键参数,包括属性上下限,以及每个属性语言变量对应的对称中心、半宽和斜度[13]。

以大气环境温度属性为例,前文为温度属性定义了5个语言变量,在语义规则库中就需要分别对这5个语言变量的参数进行设置,以供模糊逻辑查询时进行映射。如表1即为各语言变量的参数。为了更好地进行模糊逻辑查询,同时还需要对大气属性的上下限进行设置。

3.2 剧情物理规则

剧情语义规则主要是将人类具有模糊性的语言映射成数学语言,而剧情物理规则根据大气环境自身的物理特性对剧情过程进行一定的约束,使剧情产生的数据更准确、可信。

大气环境的物理规则分为两类,一类是各物理属性之间的相互约束关系,另一类是不同地域对物理属性定义的偏差。对于第一类,主要是对用户的剧情组织提供一定的约束与建议。诸如 “降雨量大”与 “气压高”很难同时发生,用户在同时设置了这两种情况时约束即产生作用,提醒用户以减少不必要的查询时间浪费。第二类主要产生于人们在不同地域对环境模糊量的定义上会产生偏差。比如处于热带的人对于温度 “适中”的定义与处于温带的人对于同一个概念的定义肯定会有一定的差异。建立物理规则库可以在模糊逻辑搜索过程中通过修正隶属度函数来消减偏差。也可在剧情过程中不区别地理差异,以绝对的数值区间定义环境属性变量。

4 剧情产品生成

大气环境剧情生成的最终目的是为仿真用户提供符合剧情组织的大气环境数据。模糊逻辑搜索引擎通过对大气环境数据库进行搜索得到一系列的候选事件集并依照隶属度进行排序。最后进行数据的后处理,即数据文件的生成和数据可视化。

4.1 剧情数据文件生成

当用户在候选事件列表中选择了数据集后,系统将数据集生成为用户选择的数据文件以供用户在仿真系统中使用。为了以用户需要的数据文件格式输出,需要考虑不同数据格式的编码问题。同时也需要对已有数据进行插值处理,以在数据库数据量有限的情况下获得更高分辨率的环境数据。在剧情生成引擎中的数据文件生成步骤如下:

(1)用户选择数据集,对数据范围、分辨率、数据格式进行设置。

(2)从大气环境数据库中获取对应范围的数据。

(3)依照用户的设置,对数据集进行裁剪和插值处理。

(4)针对用户设定的数据格式对数据进行编码输出。

数据的裁剪主要依据用户的设置对生成数据的范围进行修改。由于数据资源的限制,搜索到的数据集分辨率一般无法满足仿真系统对分辨率的需求。此时需要对数据进行插值处理,达到用户需要的分辨率。为此,本文采用双线性插值。

如图6所示,已知A、B、C、D这4点的属性值,为求P点的属性值,首先在y方向上进行线性插值,求出Q、R的属性值fQ、fR

对Q、R在x方向上进行插值得到P点的属性值fP

4.2 剧情数据可视化

模糊逻辑搜索对数据集进行隶属度计算、排序生成候选事件集。用户通过数据表无法直观的判断候选事件集中高隶属度的数据在整体分布上是否满足需求。为了给用户提供一种通过经验手段分析数据的途径,需要对环境数据进行可视化处理[14]。

图6 双线性插值

GrADS(grid analysis and display system)是由COLA推出的全32位交互操作的大气环境格点数据和站点数据的分析和显示环境[15]。本文以某一时间段的全球格点气象数据为基准数据库,基于人类语言设定相应的想定剧情,通过设计的大气环境想定生成引擎对数据库中的数据进行搜索,产生数据集。并采用GrADS软件进行数据集的可视化实现,生成数据的基本效果如图7所示。

5 结束语

本研究设计提出了剧情生成引擎的逻辑框架,包括模糊逻辑搜索模块、剧情产品生成模块以及剧情规则库,然后分别研究了3个模块的实现原理和实现方法。针对模糊逻辑搜索这一核心模块,从环境剧情的概念以及模糊集理论出发,提出了适用于大气环境剧情的模糊搜索机制和搜索算法;对于大气环境剧情规则,则以模糊逻辑搜索为目的,设计了剧情语义规范库和物理规则库,以XML文件组织和存储规则库,为剧情生成提供了语义参数和物理约束支持;而在剧情产品生成模块中,对环境数据的可视化以及基于插值法的数据生成技术开展了研究,为仿真应用中的大气环境剧情生成提供了途径。最后通过实验对大气环境想定生成引擎进行了测试,得到了符合仿真用户设定的大气环境数据。

图7 大气温度场与相对湿度等值线

[1]LIN Ju,ZHOU Baoshun,ZHANG Peng.Meteorological scenario generator oriented the simulation application [C].the 13th Conference on Control and Application,2008:5-10 (in Chinese).[林琚,周保顺,张鹏.面向仿真应用的气象想定生成系统 [C].控制与应用第十三届学术年会,2008:5-10.]

[2]SUN Liqing,WANG Xingren.Research on development of synthetic natural environment database [J].Journal of System Simulation,2007,19 (16):3688-3692 (in Chinese).[孙丽卿,王行仁.综合自然环境数据库开发的研究 [J].系统仿真学报,2007,19 (16):3688-3692.]

[3]LI Ruixuan,WEN Kunmei,LU Zhengding,et al.An improved semantic search model based on hybrid fuzzy description logic [C].Proceedings of the Japan-China Joint Workshop on Frontier of Computer Science and Technology,2006:139-146.

[4]LIN Ju.Atmosphere environment scenario data generator and it’s application[D].Beijing:Beijing University of Aeronautics and Astronautics,2008(in Chinese).[林琚.大气环境剧情数据生成系统及其仿真应用 [D].北京:北京航空航天大学,2008.]

[5]Mikhail N Zhizhin,Alexei Poyda,Dmitry Mishin,et al.Environmental scenario search engine(ESSE)–distributed,optimized,visible[EB/OL].http://esse.wdcb.ru/,2007.

[6]Zhizhin M,Kihn E,Lyutsarev V,et al.Environmental scenario search and visualization [C].Proceedings of the 15th Annual ACM International Symposium on Advances in Geographic Information Systems,2007:1-10.

[7]Son W,Jinhyoung Lee,Kim M S.Generic Bell inequalities for multipartite arbitrary dimensional systems [J].Physical Review Letters,2006,96 (6):060406.

[8]Adjei O,Chen L,Cheng H D,et al.A fuzzy search method for rough sets in data mining [C].Proceedings of IFSA/NAFIPS Conference,2001:980-985.

[9]Chen L.λ-connected approximations for rough sets [G].Lecture Notes in Computer Science 2457:Proceedings of the Third International Conference on Rough Sets and Current Trends in Computing,2002:572-577.

[10]YU Xiangxiang.Intruduction of data mining technology [J].Fujian Education of Information Technology,2005,1 (1):19-21(in Chinese).[于春香.数据挖掘技术简介 [J].福建信息技术教育,2005,1 (1):19-21.]

[11]YANG Qing,CHEN Wei,WEN Bin.Fuzzy ontology model for semantic information query [J].Computer Engineering,2010,36 (8):188-190 (in Chinese).[杨青,陈薇,闻彬.面向语义信息查询的模糊本体模型 [J].计算机工程,2010,36 (8):188-190.]

[12]DUAN Lixia.The XML data mining based on the fuzzy logic rules [J].Mind and Computation,2008,2 (1):21-26 (in Chinese).[段丽霞.基于模糊逻辑规则的XML数据挖掘[J].心智与计算,2008,2 (1):21-26.]

[13]ZHANG Peng,GONG Guang-hong.Atmosphere environment simulation scenario generator for distributed simulation system [J].Journal of System Simulation,2008,20 (19):5109-5112.

[14]ZHOU Yan.VGE and visualization of spatial data [J].Railway Investigation and Surveying,2004,30 (6):11-14 (in Chinese).[周艳.虚拟地理环境与空间数据可视化 [J].铁道勘察,2004,30 (6):11-14.]

[15]ZHANG Li,SHEN Shuanghe,SUN Xiangming,et al.Processing of non-corresponding grid data from NCEP by using GRADS [J].Journal of Meteorological Research and Application,2009,30 (3):37-43 (in Chinese).[张丽,申双和,孙向明,等.用GRADS处理NCEP资料中的非对应格点数据 [J].气象研究与应用,2009,30 (3):37-43.]

猜你喜欢
语义逻辑规则
刑事印证证明准确达成的逻辑反思
撑竿跳规则的制定
逻辑
创新的逻辑
数独的规则和演变
语言与语义
让规则不规则
女人买买买的神逻辑
TPP反腐败规则对我国的启示
“上”与“下”语义的不对称性及其认知阐释