事理图谱应用于电力安全事故预控策略研究

2022-02-28 03:42沈文斌张家瑞
现代工业经济和信息化 2022年12期
关键词:事理预控分词

沈文斌,张家瑞

(1.徐州市三新供电服务有限公司邳州分公司工程技术中心,江苏 徐州 221300;2.徐州市三新供电服务有限公司邳州分公司综合管控中心,江苏 徐州 221300)

引言

在现代化社会中,电力对于人们来说是非常重要的,无论是生活还是工作都与电力有着密不可分的关系。电力对于企业来说更是尤为重要,因此,要不断加强电力安全工作的实施,能够为企业安全生产提供有效保障。电力安全事故的发生不利于社会和谐、稳定的发展,且会对相关电力用户的安全造成极大的危害。特别是对于一些高楼层的建筑物来说,一个大厦的运转与电力是分不开的,若用电检查工作效果不好,就不能为其提供安全用电的保障,会出现很多安全隐患问题,进而产生电力安全事故,为有效预防此类事故的产生,可通过事理图谱的引用来实现有效预防和管控,进而才能避免火灾等灾害的发生。事理图谱作为新型电力安全事故预控的理念与技术,关于其在电力事故预控方面的研究,属于新型研究议题,进而能够体现出本次研究的创新性。

1 事理图谱概念分析

从事理图谱原理来看,知识通过特定领域描述、关系及过程而形成,这种组织形式的形成自从1962年以来,就通过不断的形式发展与变更而成为如今的知识图谱。在进入21世纪后,最早提出的知识图谱理念是由谷歌团队所提出,该理念的出现随即引发了大量专家学者的高度关注。最初,这一理念的形成主要是为全面提升搜索引擎效率及水平,以此来丰富其功能性,目的就是通过提升用户搜索质量,以此来使其感受到更具科技性的搜素体验,同期最初设计理念一样,事理图谱通过实际应用,早已实现这一理念。随着时间的推移,其应用领域不断拓展,尤其是在计算机网络应用方面,不同的搜索网站以知识图谱这一体系作为基准来实现搜索范围及领域内容的拓展,以此来优化并升级了搜索网站的性能,使其更具实用性。

近年来,在信息化技术的推动下,关于事理图谱的研究再次成为专家学者们重点研究的事项,在各大技术论坛方面,有相关学者明确指出了知识图谱与事理图谱的发展转变,代表了科学技术质的发展,并一再强调事理图谱的出现,能够更加深入地了解事件和事件间演化规律与事理逻辑。在事件定义方面,在自动内容抽取测评会议上,事件被认为是一个动作的发生或状态的变化,事件大多被表示为谓语+论元的结构,从而更加适合事理图谱的应用,其能够形成完善的问答系统。2018年,某大学科研部门首次提出了金融事理图谱的概念,其运用的语料已为腾讯、网易等大型企业网站广泛运用,同时,在开放领域新闻文本中能够借助事理图谱的创设方式来使其涵盖多件事件节点及约不同的因果关系,这些工作证明了事理图谱的实用性。而对于电力安全事故的防控来说,因其能够预测事件走向的特性,进而就能为有效预防与管控电力安全事故提供保障。

2 电力事故事理图谱构建原理

2.1 研究框架

对于电力事故的预控在说,在事理图谱应用方面,其主要体现在以下5个阶段。

1)以运用python编程为主导来采集电力事故相关数据信息,通过对数据信息的整理与分析,并以运用北京工业大学自然语言处理平台LTP工具中Pyltp模块实现文本中词句的分析。在具体分析中,形式以分句分词及去除停用词的方式为主。

2)从电力事故的角度来看,其文本数据信息大多为半结构化数据,每1个事故文本中都涵盖了1条事故的事件链,而这些事件链则是若干个事件槽所组成。对此,在具体分析事故事件链放慢,需进行标识词设计,并从文本中采集来每个事故的事件链,通过句型结构来对事件槽进行分类,以此来深入探究电力安全事故中事件槽的具体关系。

3)借助Word2vec训练的方式来分析事件槽词向量,主要以相似度计算法为基准来进一步了解电力事故中的泛化事件槽。

4)以热力图矩阵为主导进行泛化记录,以此来认定其为电力事故中事件槽次数权重,借助Neo4j图数据库构建以事件槽节点与事件槽关联关系为边、权重为边属性的电力事故事理图谱。

5)以阶段3为基准,通过事件槽泛化归类且根据所构建的事理图谱来对整个电力安全事故进行推演与预测,进而为预控电力安全事故的策略提供参考依据[1]。

2.2 抽取事件链

前文提点每一件电力安全事故中的文本的都有1条事故具体内容的半结构化数据文本,其主要涵盖的内容就有事故概率、事故原因、事故类型及事故结果等等,这些内容中的文本句式形成1条完善的事件链,而事件链中涵盖了电力安全事故的各类信息,在具体事例图谱的构建中,还需通过事件标识词的设计来实现事件链的提取,表1为某电力安全事故中,应用事例图谱实践标识词设计的相关事项[2]。

表1 事件标识词

2.3 事件槽相似度算法

1)概念图谱,以规则模板抽取的事件槽可能属于同一类表达含义,概念事理图谱的过程可见图1。

图1 概念图谱

2)相似度算法,由于电力安全事故中所涉及的领域内容较多,且事故原因较为复杂,在进行相似度计算方面,若是以采取聚类法的方式为主,则会导致聚类簇不断增加,最终会不断提升选取难度。为避免此类现象的产生,此次研究将以改进电力安全事故中文本词句的方式来进行相似度计算[3]。

在计算词语相似度方面,事件槽分词后式子表达为e={w1,w2,…,wi},每个分词w可根据Word2Vec来进行转对应的词向量vec的转变,而根据余弦相似度的计算能够获取至少两个词语间相似度,具体计算公式如(1)所示:

式中:sim(wi,wj)代表了至少两个词语间的相似度;而i与j代表序号;vecik则是词向量veci第k个分量值的体现;vecjk是词向量vecj第k个分量值;x代表词向量分量个数[4]。

在事件槽相似度方面,需要以词语相似度的计算为基准来进行事件槽相似度计算,具体可见式(2):

式中:sim(e1,e2)为事件槽e1与e2相似度;通过处理2个事件槽分词则可得出分词集合S与(Di,Sj)]代表相似度高的M个词语的相似度之和;sim(Di,Sj)代表了集合D中第i个分词与集合S中第j个分词间的相似度。

3 事理图谱应用于电力安全事故预控策略分析

3.1 数据来源及处理

以国家能源局公布的2015至2021年间305起电力安全事故文本数据为基准。

3.2 电力安全事故事件槽对提取

根据事件标识词和规则模板提取事件链和事件槽,形成420条因果事件槽对和688条电力安全事件槽对。

3.2.1 电力事故事件槽泛化

步骤1:在运用事件槽相似度算法前,对事件槽中描述公司名、地点、数字和时间等干扰词语进行停用,提高泛化精度。

步骤2:随机选取一事件槽,运用公式(2)计算该事件槽与其他事件槽相似度,相似度大于0.60的泛化为同一类。

步骤3:从剩余事件槽中随机再选一事件槽,重复步骤2来进行能事件槽泛化,泛化流程具体可见下页图2。

图2 泛化流程示意图

3.2.2 电力事故事理图谱构建

电力事故事理图谱的构建采用Neo4j图数据库显示,事件槽泛化后,共计370个节点,550条边。

4 结语

从上述研究分析来看,在电力事故安全预控方面,通过构建事理图谱,以运用采集与整理各类数据信息的方式和设计事件标识词为基准,根据相关规则模板来进行事故事件链与事件槽的提取,进而能够得出其中的因果关系,并以相似度算法为准来进行计算[5]。由于此类学术研究参考文献资料较少,本次研究重点以突显理论叙述为主导来体现出事理图谱在电力安全事故预控方面应用的实效性,从而能够进一步了解事理图谱在电力安全事故应用中的相关事项[6]。总的来说,为了有效避免电力安全事故的产生,不仅要重视事理图谱的应用,在此基础上,还需不断加强供电人员自身的安全意识,且通过开展专业化培训的方式来使其更加了解事理图谱构建与应用的相关事项,使其能够在实际工作中更加合理且娴熟的进行事理图谱的运用,以此来有效预控电力安全事故的产生。

猜你喜欢
事理预控分词
疫情预控公益广告
谈如何做好房建监理开展前的预控工作
阐释现象 揭示事理——说明文写作六步曲
分词在英语教学中的妙用
语 丝
结巴分词在词云中的应用
结巴分词在词云中的应用
监理预控在工程实施中的有效应用
实现安全预控管理的几点探讨
一语中的