不确定时态跨度的语义处理及其粗糙集近似计算

2015-06-01 10:57左亚尧封朝永
广东工业大学学报 2015年1期
关键词:精确度粗糙集跨度

左亚尧,陈 磊,封朝永

(广东工业大学 计算机学院, 广东 广州 510006)

不确定时态跨度的语义处理及其粗糙集近似计算

左亚尧,陈 磊,封朝永

(广东工业大学 计算机学院, 广东 广州 510006)

蕴含语义的不确定时态的表示及处理是不确定时态信息和自然语言处理领域中的重要问题,不确定时态跨度是不确定时态中的重要组成部分,而不确定的语义是造成时态跨度不确定性的根源.提出对不确定语义进行转换的思想,将其转换为邻域或区间的形式,成为可计算问题;进而从粒度层面对不确定时态跨度进行了有效刻画,给出了元组化的模型,使其可以参与运算;提出了时态粗糙集将时态跨度元素在离散状态下进行划分,采用下近似和上近似的思想划分了不确定时态跨度中的确定元素和不确定元素;并提出了不确定时态跨度的近似精确度计算方法.

不确定时态跨度; 语义; 时态粒度; 时态粗糙集; 近似计算

近年来,随着信息技术的飞速发展,大数据已普遍存在,能源制造业、服务业、医疗卫生等领域都积累了TB、PB级乃至EB级的大数据[1].时态数据是大数据中重要的一类,它大量存在于新闻事件、医疗信息系统、交通系统等应用领域,而且在时态数据挖掘、时态知识以及时空信息处理等众多研究领域扮演着越来越重要的角色[2].不确定时态跨度是时态信息研究领域中重要而又特殊的一个组成部分,常见的不确定时态跨度,其表征为不确定的时间介词,如,“大约/左右”、“至少”、“至多”、“之间”;与被参照的确切时态跨度,如,“2个小时”、“4个到5个小时”、“5天”,相结合所构成的.例如:“小赵步行了2小时左右”、 “台风离去需要至少3天”.不确定时态跨度包含了不确定的时间介词和被参照的具有粒度属性的时间跨度,它们属于没有先验知识的不精确的概念,如何处理不确定时态跨度中的不确定语义并对其精确度进行近似度量,是当前不确定时态信息研究领域的热点和难点.

近年来,大数据的研究如火如荼,人们对时态信息和不确定时态信息研究也在不断地深入, 一些学者或从时态语义的角度出发探索时态的建模和表示问题[3-6];或着重以粒度的思想对时态问题进行刻画和演算[7-10];或针对特殊的时态数据采用有针对性的数学模型[11-13].

如,文献[3]提出了一个集成到Web搜索引擎中的时态表达式识别和标准化系统,能够同时考虑用户查询和搜索集合中的时间语义,并独立于其表示;文献[4]研究了时态语义数据的编码问题;文献[5]提出了基于注释的时态概念模型,推广了传统的概念模型语义;文献[6]提出一个概念框架来独立地描述不确定时态语义和不完整信息,并且能够保证不丢失信息及其不确定性;这些学者在一定程度上研究了时态语义,但未解决时态语义参与运算的问题且忽视了时态的粒度属性.

粒度是时态的重要属性,文献[7- 8]研究了不确定知识的粒计算模型;文献[9]研究了确定时态的粒度刻画及演算问题;文献[10]探索了确定时态粒度层次映射转换的时态粒点差运算方法.而如何把时态粒度和语义相结合,使其参与运算,是时态信息处理领域中的一个难点.

针对时态的近似计算问题,文献[11]提出了一个框架,通过随机过程来计算可能出现的物体运动轨迹,可以有效地对不确定时空数据进行建模和查询;文献[12]提出一种基于模糊区间值的模糊区间关系模型来表示不确定的时态信息,并且提出了一种基于Allen经典区间代数[13]新的模糊区间代数.

本文研究了不确定时态跨度的语义,对其进行了转换,结合时态粒度给出了不确定时态跨度的形式化描述,使其可以参与运算,根据粗糙集理论[14-15],引入了时态粗糙集模型,借助时态粗糙集模型对不确定时态跨度进行重新划分,进而在此基础上对不确定时态跨度的精确度进行了近似计算.

1 不确定时态跨度的语义转换及粒度化建模

1.1 不确定时态跨度的粒度刻画及语义转换

时态的粒度描述,如时间测度、时态划分、时态粒度、嵌套粒度等定义参见文献[9-10].

蕴含不确定时间介词的不确定时态跨度,其不确定性源自于不确定的语义,有4种情形,可对其进行语义转换,使其成为可计算问题.

图1 不确定时态跨度的4种情形Fig.1 4 forms of uncertain temporal span

对于不确定时态跨度的表示,须限定在一定的范围内,例如:“大约3个小时”,时间偏移量Δta、Δtb均为0.5GH时,其可能的取值范围为[2.5GH,3.5GH],语义可信度较高;如果将取值范围扩大至[0,1GD]时,语义可信度较低,无实际意义.

1.2 不确定时态跨度的粒度模型

结合不确定时态跨度语义转换后的形式并考虑其通用性,建立不确定时态跨度的模型,不确定时态跨度的模型是一个六元组:

其中:

(1) 不确定时态跨度的名称标识tus,是符号化的元组语义;

(2) 不确定时态跨度的运算粒度Gj,如“3小时左右”,其一种表示为[2.5GH,3.5GH],即模型tus(3GH,GH,-0.5,+0.5,f)中的运算粒度为GH,即为“小时”;

(4) 不确定时态跨度的时态近似精确度度量函数f,是对不确定时态跨度的近似确定程度的描述函数.f的计算方法将在下文第3节进行详细讨论.

例如:“3小时左右”可表示为tus(3GH,GH,Δtl,Δtr,f),其中的一种情况为tus(3GH,GH,-0.5,+0.5,f),表明tus的取值为区间[2.5GH,3.5GH]中的一个连续的时态跨度.

“至少3个小时”可表示为tus(3GH,GH,Δtl,Δtr,f),其中的一种情况为tus(3GH,GH,0,+2,f),表明tus的取值为区间[3GH,5GH]中的一个连续的时态跨度.

2 不确定时态跨度的粗糙集划分

粗糙集[16-17]是对不确定、不精确概念[18]进行定性和定量描述的一种有力的数学工具,基于时态粒度,对不确定时态跨度进行语义转换和粒度建模后,在时态元素离散化的前提下,论文借助经典粗糙集[19]理论提出了对不确定时态跨度进行划分的思想,区分出不确定时态跨度中确定的元素和不确定的元素,进而可对不确定时态跨度的近似精确度进行定量的描述.

2.1 时态粗糙集

时态粗糙集是一种新的集合.其中的元素均为时态元素,是一种只有大小而没有序关系的时态元素的集合.由于时态粒点和时态粒区存在严格的序关系,严格对应于时间轴上的点或区间,所以它并不适用于划分不确定时态粒点和不确定时态粒区,但它适合描述不确定时态跨度.由于时态跨度只有数量关系上的大小之分而没有时间轴上序关系的前后之别,因此,可以将不确定时态跨度映射到时态粗糙集之中.

基于时态粗糙集,可划分不确定时态跨度中确定元素和不确定元素,将离散化的时态中确定的元素和不确定的元素重组并分成两个部分,由一对时态集合表示,即时态上、下近似,形式上时态粗糙集有如下定义:

图2 时态粗糙集模型Fig.2 The temporal rough set model

将不确定时态跨度离散化,再将确定的元素和不确定的元素分开并重组成两部分(两个集合)称作不确定时态跨度的粗糙集划分,此举使下文不确定时态跨度的近似精确度度量成为可能.

2.2 不确定时态跨度的粗糙集划分

图3 不确定时态跨度的时态粗糙集划分Fig.3 The division of uncertain temporal spans with rough set

3 不确定时态跨度的近似精确度计算

根据不确定时态跨度的粗糙集划分,可计算其时态近似精确度大小或讨论其时态近似精确度函数的变化情况.

3.1 时态近似精确度

对于1.3节定义的不确定时态模型元组中的近似精确度度量函数f,现给出形式化定义.

定义3(时态近似精确度) 对于不确定的时态元素,包括不确定时态粒点、不确定时态粒区、不确定时态跨度,其可规划的确定的程度称为时态近似精确度,记为f∈[0,1],根据时态粗糙集,定义时态近似精确度:

(1)

3.2 不确定时态跨度的近似精确度计算

图4 的粗糙集划分及细化等价形式Fig.4 The division of and its detailing

(2)

(3)

图5 的粗糙集划分及等价形式Fig.5 The division of and its detailing

图6 的粗糙集划分及细化形式Fig.6 The division of and its detailing

(4)

4 结束语

本文研究了不确定时态的语义处理及近似计算等问题.不确定时态跨度是一种特殊的时态元素,只有数量关系上的大小之分而没有空间上的前后位置关系之别,论文提出了将不确定语义进行转换的思想,并对其进行粒度刻画,使蕴含不确定语义的时态跨度可以参与运算,提出了时态粗糙集在不确定时态跨度离散化的前提下将其中确定的元素和不确定的元素区分开来,并对其时态精确度进行了近似计算.文章下一阶段的研究方向是将不确定时态跨度进行相应的绑定操作,赋予其时间轴上具体的涵义.

[1] 孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169.

Meng X F, Ci X. Big data management: Concepts, Techniques and Challenges[J]. Journal of Computer Research and Development,2013, 50(1):146-169.

[2] 李建中,刘显敏.大数据的一个重要方面数据可用性[J].计算机研究与发展,2013,50(6):1147-1162.

Li J Z, Liu X M. An important aspect of big data: data usability[J].Journal of Computer Research and Development,2013, 50(6):1147-1162.

[3] Vicente-Diez M T, Martinez P. Temporal semantics extraction for improving web search[C]∥DEXA’09. 20th International Workshop on Database and Expert Systems Application.Atlanta: IEEE, 2009: 69-73.

[4] Taylor S E, Bernard M L, Verzi S J, et al. Temporal semantics: An adaptive resonance theory approach[C]∥IJCNN 2009. International Joint Conference on Neural Networks.Atlanta: IEEE, 2009: 3111-3117.

[5] Khatri V, Ram S, Snodgrass R, et al. Capturing Telic/Atelic temporal data semantics: Generalizing conventional conceptual models[J].IEEE Transactions on Knowledae and Data Engineering,2012, 26(3):528-548.

[6] Chountas P, Petrounias I. Modelling and representation of uncertain temporal information [J]. Requirements Engineering, 2000, 5(3): 144-156.

[7] 王国胤,张清华.不同知识粒度下粗糙集的不确定性研究[J].计算机学报,2008,31:1588-1598.

Wang G Y, Zhang Q H. Uncertainty of rough sets in different knowledge granularities[J]. Chinese Journal of Computers, 2008, 31(9):1588 -1598.

[8] 王国胤,张清华,马希骜,等.知识的不确定性问题的粒计算模型[J].软件学报,2011,22(4):676-694.

Wang G Y, Zhang Q H, Ma X A, et al. Granular computing models for knowledge uncertainty[J]. Journal of Software, 2011, 22(4): 676-694.

[9] 左亚尧,汤庸,舒忠梅,等.时态的粒度刻画及演算问题研究[J].计算机科学,2010,37(12): 114-119.

Zuo Y Y, Tang Y, Shu Z M, et al. Research on the characterization and the calculus of temporal granularities[J]. Journal of Computer Science,2010, 37 (12) : 114-119.

[10] 左亚尧,汤庸,舒忠梅.基于粒度层次映射转换的时态粒点差运算方法[J].计算机研究与发展,2012,49(11): 2320-2327.

Zuo Y Y, Tang Y, Shu Z M. Subtraction operation between temporal points with granularities based on granularity hierarchy mapping[J].Journal of Computer Research and Development,2012, 49(11): 2320-2327.

[11] Emrich T, Kriegel H P, Mamoulis N, et al. Querying uncertain spatio-temporal data[C] ∥ 2012 IEEE 28th International Conference on Data Engineering (ICDE).Arlington,Virginia USA: IEEE, 2012: 354-365.

[12] Huang Z Q. Fuzzy temporal interval relationship based on interval-Valued fuzzy sets[C]∥Proceedings of the Fourth International Conference on Fuzzy Systems and Knowledge Discovery.Haikou:IEEE,2007:169-172.

[13] Allen J F. Maintaining knowledge about temporal intervals[J]. Communications of the ACM, 1983, 26(11): 832-843.

[14] Yao Y Y. Interval sets and interval-set algebras[C]∥ICCI’09. 8th IEEE International Conference on Cognitive Informatics.Hong Kong:IEEE, 2009:307-314.

[15] Li H X, Wang M H, Zhou X Z, et al. An interval set model for learning rules from incomplete information table[J]. International Journal of Approximate Reasoning, 2012,53(1):24-37.

[16] Pawlak Z. Rough sets[J]. International Journal of Computer & Information Sciences, 1982,11(5): 341-356.

[17] Pawlak Z. Rough sets:Theoretical aspects of reasoning about data[M].San Francisco:Kluwer Academic Publi shers,1992.

[18] 李岚,金朝永.一类多变量不确定非线性系统的自适应模糊监督控制[J].广东工业大学学报,2012,29(2):79-84.

Li L,Jin C Y.Adaptive fuzzy control for a class of uncertain nonlinear MIMO systems with supervisory control performance[J]. Journal of Guangdong University of Technology,2012, 29(2):79-84.

[19] 吕丹,吴孟达, 张学志.可拓集合与粗糙集合[J].广东工业大学学报,2005,22(4):120-123.

Lv D,Wu M D,Zhang X Z.Extension and rough set[J]. Journal of Guangdong University of Technology,2005,22(4):120-123.

Semantic Processing and Approximation Calculation Based on Rough Set of Uncertain Temporal Span

Zuo Ya-yao, Chen Lei, Feng Chao-yong

Presentation and processing of uncertain temporal which contains semantics are important issues in uncertain temporal information processing and natural language processing. Uncertain temporal span is an important part of uncertain temporal, however, the uncertain semantics is the root of uncertainty. This paper proposes the idea of converting the uncertain semantics to the forms existing in neighborhoods or intervals that could be calculated and described on the granularity level. At the same time, a tuple model was given to render uncertain temporal span to join the calculation. Then a temporal rough set is suggested to divide the certain or uncertain elements of temporal span according to lower approximation and upper approximation. Finally, the approximate accuracy calculation of uncertain temporal span is presented.

uncertain temporal span; semantic; temporal granularity; temporal rough set; approximation calculations

2014- 04- 16

国家自然科学基金资助项目(60970044);广东省自然科学基金资助项目(S2011040004281,S2013010014457)

左亚尧(1974-),男,副教授,博士,硕士生导师,主要研究方向为时态信息处理、粒度计算、数据仓库与数据挖掘.

10.3969/j.issn.1007- 7162.2015.01.020

TP301

A

1007-7162(2015)01- 0098- 05

(School of Computers, Guangdong University of Technology, Guangzhou 510006, China)

猜你喜欢
精确度粗糙集跨度
缓粘结预应力技术在大跨度梁中的应用
基于Pawlak粗糙集模型的集合运算关系
大跨度连续刚构桥线形控制分析
研究核心素养呈现特征提高复习教学精确度
“硬核”定位系统入驻兖矿集团,精确度以厘米计算
基于二进制链表的粗糙集属性约简
组合铝合金立柱在超大跨度玻璃幕墙中的应用
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
大跨度高速铁路桥梁健康监测系统研发