从通用知识图谱中剖析电力知识图谱的应用

2021-03-27 05:57国网河南信通公司贾海锋王冰洁
电力设备管理 2021年11期
关键词:结构化图谱实体

国网河南信通公司 贾海锋 王冰洁 王 浩 孙 元

2012年Google首次发布了知识图谱产品,在工业界和学术界都产生了巨大的反响。百度推出的“知心”、搜狗推出的“知立方”,主要目的是利用知识图谱的特点改进其自动问答模块的内容检索质量。随着信息化的发展,电力系统的规模逐渐扩大,系统中的知识结构也随之剧增,而电力行业作为国家重大的基础能源体系,由于新的知识的持续加入,知识体系结构的复杂化、异构化知识不断增加,电力系统的知识也不断出现复杂性和多样性[1]。为实现电力领域的智能化技术创新和知识管理,加强对自动化电力数据的充分利用,将人工智能技术和电力技术相结合,为实现下一个电力领域目标确定新的发展方向。

知识图谱是融合传统数据库和人工智能相关技术的智能化结构图数据库,它的特点是可以实现对大规模的知识进行结构化管理。知识图谱的构建具有特殊性,更多的是体现数据中实体和实体相关的属性,在全局的生态模式中很难做到统一的管理[2]。

1 通用知识图谱的研究

知识图谱(Knowledge Graph)的本质是将实体要素间的关联关系结构化表示,它是通过边(Edge)和节点(Point)的连接将数据以图结构的方式进行存储。其中,实体以节点的形式表示,两个实体间存在的某种关系用边表示。正是因为知识图谱体系架构的特殊性,它能把大规模且复杂多样的数据信息连接在一块,形成图形化的关系网络,也是数据间最直观有效地表示方式。知识图谱的最大特点是能更精确表示实体间的关系,因此从关系角度分析,Google实现并推出知识图谱主要是利用知识图谱可以更好地查询复杂信息间的关联,从语义角度提高搜索结果的质量,优化搜索引擎、甚至是实现问题的推理,从而理解用户的真实意图。对较为复杂的搜索问题仍能准确的返回正确的信息,这就说明搜索引擎通过知识图谱真正理解了用户的真实意图。

通用知识图谱,就是大多数人都能经常用到且数据较为统一时所构建的知识图谱,对于知识结构相同、内容类似的数据,构建通用型知识图谱可更大的扩充知识网络。一般是解决常识类、百科类等的问题,没有特殊领域的针对性、局限性。

例如,DBpedia是集成了维基百科大规模多语言数据的常识性知识图谱。DBpedia使用多种知识抽取和知识融合方法将维基百科中的知识信息进行结构化抽取,将结构化信息转换成三元组结构,利用实体和实体间的关系形成结构化的图数据库;BabelNet是一个由实体、关系和概念结构化组合形成的语义网络(Semantic Network),它是目前世界范围内最大的多语言同义词典。目前BabelNet收集到的词汇已经超过1400万个,每一个词汇都对应一个同义的集合,而每个同义集合中都保存了多种语言的同义词。因此,大规模的结构化数据在知识图谱的推动下促进了人工智能的发展。综上所述,通用知识图谱基本包含以下特点:面向的通用领域、数据结构化强、使用者大多是普通用户、以常识和公共知识资源为主。

2 电力知识图谱的研究

基于知识图谱应用的研究主要可分为两大类:特殊领域知识图谱、通用知识图谱。特殊领域知识图谱主要是针对企业或具体特殊行业,是根据对某个行业或领域的子领域进行深入剖析所制定的方案,主要是解决当前行业或特定领域的专业问题。随着电力行业的飞速发展,电力能源的使用促使行业数据不断扩张,然而在建设智能化信息平台的过程中可能会忽略对产生的数据系统化和结构化的管理,导致知识体系混乱、复杂,除结构化数据外,大部分数据都是以文本、图片等非结构化数据的形式存储[3]。此外由于电力领域业务较多,产生的电力数据的维度也有很多异构、复杂、多样的数据资源对电力数据的管理产生一定的困扰。

知识图谱近年来在知识梳理业务上起到至关重要的作用,无论是通用领域,还是金融、法律、军事等一些特殊领域也受到了广泛的关注和应用。而电力领域下又包含多个子领域,电力数据复杂多样,因此,知识图谱在电力领域的业务使用也更为广泛,其中自然语言处理中信息抽取、实体识别等技术都为构建电力领域的知识图谱提供了极为重要的基础[4]。

随着电力系统的增程式发展,信息化数据的通信量也随之增大而形成了复杂的信息网络,可再生资源的普及率也越来越高。开发智能电力系统,推动电力的快速发展,建设安全、环保、高效的电力能源系统的任务也越来越紧迫。目前人工智能作为一种新兴的科学技术而崛起,为实现智能化电力系统提供了有力的帮助,尤其是人工智能能够与大数据、云计算、物联网等技术相结合,使电力系统往安全可控、智能交互的方向可持续发展。因此,在科技水平的推动下电网的安全性、可靠性和灵活性可以大大提高。

知识图谱在电力领域中智能运维的应用:知识图谱与电力领域知识库相结合,构建智能化的运检知识管理和理论认知的推理系统,实现安检工作人员对不同类运检知识的快速学习和问题解答,实现对检修工单和工作票的智能化存储、对比;知识图谱在电力客服智能系统中的应用[5]:结合自然语言处理和智能识别的一系列知识融合技术,构建电力客服数据基础库和电力领域主体知识库,建设电力客服领域知识图谱并开发电力客服智能问答系统,精确响应客户需求,提高服务效率,全面提升电力客户服务水平。

3 电力知识图谱的构建和关键技术

知识图谱是通过知识信息抽取、知识融合等技术将大规模数据处理成实体和关系互相连接而形成的网络结构,由“实体-属性-属性值”或“实体-关系-实体”三元组构成[6]。一个知识图谱主要分四步构建:

电力领域知识存储的设计:是对构建知识图谱的一种规则约束,其中包括知识库中的实体、实体间关系、实体属性等关键信息;知识获取:获取电力系统中特定领域的相关数据,通过自动化技术抽取有用的知识信息。如运检设备中的设备台账数据、设备缺陷数据、工单数据、检修记录等,通过智能化技术迅速的将电力数据转化为可存储数据,对于非结构化数据,可采用命名实体识别、基于模版规则的识别、基于智能模型的识别等人工智能技术,对非结构化数据进行抽取归一化、结构化。

知识融合:是高层次的知识组织,使来自不同知识源的数据进行结构化抽取之后,在同一规范下进行实体对齐、加工、整合,最终形成高质量的知识库;知识存储:整合知识主要是以图数据库的形式存储。图数据库中的节点表示实体、子领域、属性值等,边则代表了实体要素间的关系信息及实体和属性间的关系。

4 结语

在当今的大数据和信息化时代,各行业的知识数据都面临着爆炸式增长,知识的表达和组织方式以及对知识的智能化管理和应用成为了行业的研究热点。知识图谱是以图的形式实现实体和实体、实体和属性之间关系的知识库,可以更直观的分析和利用数据资源,为了体现知识图谱在电力系统中的应用,文章深入剖析通用知识图谱的相关研究,推理并分析在电力领域知识图谱的构建和相关关键技术。

在电力领域中,保证电网的安全运行、精益电力的管理、提供优质的电力服务、实现精准的电力投资是电网的基本任务[7]。因此,构建电力领域的知识图谱,对电力数据资源智能分析和管理,进而推动电力行业的进步。电力领域的知识图谱为上层应用的开展奠定了良好的基石,具有广阔的应用前景。

猜你喜欢
结构化图谱实体
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
绘一张成长图谱
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
前海自贸区:金融服务实体
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
补肾强身片UPLC指纹图谱
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”