语音检索在电力调度领域的发展

2021-09-22 06:14朱余启朱润杭伞晨峻莫熙
电子技术与软件工程 2021年15期
关键词:语料意图语料库

朱余启 朱润杭 伞晨峻 莫熙

(云南电网有限责任公司 云南省昆明市 650200)

伴随着人工智能技术的发展,电力企业也紧跟步伐,大力发展人工智能在电网中的应用,如今语音识别系统开始走向实用化的进程,随着发展计算机对于人类语言的容错性也大大提升,更深入的理解人的意图,来执行人的意愿。语音识别已经深入到人们的日常生活生活中并扮演着关键角色也成为了人们生活的伙伴和工作的助手,语音技术的不断突破,对任何一个能够从语音互动中获益的行业来说,它将彻底改变使用和服务的方式,大大提升工作效率。为减轻电力调度系统工作人员的压力,将语音检索运用到日常工作中,提升信息快速筛选、快速获取能力。

1 语音技术的发展

从20世纪50年代开始,开展了语音识别技术的研究工作,20世80年代后,HMM技术基本成熟,21世纪以来语音识别技术飞速发展,伴随统计学被引入到语音识别中,语音识别技术从模板化匹配转向统计模型技术。语音识别技术发展到今天,国内关于文语转换技术和基于中小词汇量的语音命令识别技术已经达到比较实用的程度,特别是中小词汇量非特定人语音识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这为语音识别的实际应用扫除了障碍,众多领域已经开始实际应用这项技术,各类计算机软件也是如此,在电力系统调度过程中,也完全可以利用该技术进行语音控制。

语音识别正确率的一些影响因素有:在噪声环境下识别率较低、口语化语言和方言识别率低等。在实际应用中,调度中心的工作环境很好,并不存在噪声干扰的问题;调度员在进行操作时也完全可以避免使用口语和方言。因此,语音识别技术的发展水平为电力调度领域的实际应用奠定了客观基础。

电力行业一直以来都是国际国内先进技术的集中应用之地,代表了同类技术的最高水平。因此将语音识别及控制技术在电力系统尤其是调度中心进行深入应用研究是非常有意义的。[1]

2 语音识别基本原理

语音识别即为将通过降噪处理的语音进行特征提取,之后对语音信号特征进行处理并输出识别结果。[2]如图1。

图1:语音识别原理

语音识别,可将用户语音信息实时转换成文字,通过建立电力专业词汇库、特定声调库,基于最新的深度神经网络(DNN)的建模方法,采用基于WFST动静态结合的Viterbi解码技术,搭建调控语音辨识模块。通过在声学特征库中构建方言语音库,在语言模型中构建电力专业词汇库,提高电力专业术语文字转换正确率。

语音识别和语音合成作为独立的模块存在,通过服务的方式接收语音,经过噪音处理、特征提取、语音解码等过程,以服务的方式输出文本(如图2)。

图2:语音训练

语音识别系统采用统计模式识别技术,由以下几个基本模块所构成:

(1)信号处理及特征提取模块,从输入信号中提取特征,供声学模型处理。同时,采用一些信号处理技术,以降低环境噪声、信道、说话人等因素对特征造成的影响。

(2)统计声学模型是采用基于多粒度隐马尔科夫模型进行建模。

(3)发音词典,包含系统所能处理的词汇集及其发音(调控专业词典)。发音词典实际提供了声学模型建模单元与语言模型建模单元间的映射。

(4)语言模型,对系统所针对的语言进行建模,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,主要采用的还是基于统计的N元文法及其变体。

(5)解码器,是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。

语音识别和语音合成是相对成熟的技术,在电力行业偶尔也有应用,但其难点在于语音识别的准确率,因此,一个适用于电网调控领域的训练工具非常重要,训练电网调控业务的语言模型,以提高语音识别的准确度。

3 语义理解基本原理

语义理解也叫意图理解,意图理解包括意图分析、对话状态跟踪及对话决策。

(1)意图分析是把用户说的话标准化成计算机可以处理的标准形式。

例如:意图名称<槽位1,槽位2,……>,

通知相关单位<单位名称,通知内容>

意图分析分为两个基本模型:

1.意图分类模型,负责把用户说的话分类成若干个意图。

例如:电网调用场景有通知相关单位、打开开关等100个意图,意图分类模型就是判断用户说的话是这100个意图里的哪一个。

2.槽位提取算法,意图分类完成后,提取算法负责将槽位信息抽取出来。

(2)对话状态跟踪。对话状态,指用户在人机交互过程中,说过什么话,表达过什么意图以及意图的置信度。

对话状态跟踪,指在会话进行中管理在当前对话状态里要记录哪些用户意图或槽位信息,删掉哪些意图或槽位信息。

(3)对话决策,指根据对话状态,会话系统要做什么答复或执行什么动作。

当电力场景的音频被语音识别成文本后,进入文本的后处理流程,主要有自然语义理解(NLU),自然语言生成(NLG),语音合成(TTS),会话管理(DM),会话解析(MDM),从而形成一个人机对话交互的过程,实现一些具体的业务功能,能够代替人工做简单的重复性的工作,提高工作效率和减少人力投入。

意图管理实现用户意图及意图参数的配置,包含意图语料、意图模板表达、词槽配置等。

意图语料库:同一个意图可能存在多条的意图语料,尽可能完善所有的常用语料,提高保证意图语义理解的准确率。

意图配置:配置意图所需要实现的业务功能,同时通过模板表达式利用词槽配置每个意图需要的信息,配置通用的语义表达。

词槽实体维护:每个词槽会对应一系列的实体(词典),应用名称词槽可以包括许多应用名称,提供新增、删除、导入等功能。

4 语音技术引入电力调度领域的意义

目前,调度员的工作对信息的交互要求更高,传统的电力系统软件服务已经不能满足日常工作的需要,表现在:

(1)特殊情况下,海量信息的快速定位查找,例如无法快速使用有线输入方式;

(2)工作效率待提升。

将语音识别技术引入到调度日常工作中,使得调度软件系统也将由如今的被动静态架构变化为具有主动辨别能力语音检索的智慧系统,通过人工智能语音识别技术在海量的数据中精准、迅速的定位所需内容,提供一流信息检索效率,让调度运行工作中的海量信息检索更加精准化、友好化,通过配置电力术语,根据自动建立的关键字列表、相应操作的对应关系建立语音关键字操作数据,应用于调控人员工作操控,使调度人员抛开鼠标,抛开键盘,不必记录程序路径和程序中繁杂的按钮位置,解放双手,省下按键或手写输入花费的时间,让调度人员更加轻松和高效,使调度员专注于电网运行,减轻电网调控人员的运行压力,提高电网调控操作的智能化水平,保障电网安全稳定运行。

5 语音检索在电力调度领域的发展

语音检索,简而言之就是将语音内容转化成文本信息之后,通过自然语言解析技术,提取出关键的电网信息、操作信息等数据,将提取的关键字与本身构建的电网规则数据库进行智能匹配,结合全文内容,转化为系统可以理解电网信息或者操作知识,以一种智能调度管家助理的方式,为调度人员提供辅助决策。针对电力调度经常使用的专业术语、专有名词、习惯表达方式、特殊读音、特殊符号进行语音识别训练,采用适用于电力调度的行业语音识别技术。[3]

传统的有线输入存在输入效率底下、输入手段受限等问题,在语音识别的技术支持下可实现对电网信息进行智能语音检索,具备人机之间语音的智能交互,例如语音导航功能,长音频、短音频识别,音频转文字,生成的文字记录可以供各类应用使用。[4]利用自然语言处理技术实现与调度员、运行人员、检修人员、管理人员、设备巡检机器人等五类人智能交互,包括语音、短信和各系统间数据推送(值班日志自动记录、故录调取、调度电话监听等)等多种形式。

采用声学建模、训练、调参等机器学习方法,对收集的语音语料、文本语料进行处理,根据调度通话内容或其他口述语音、调度运行对应的文档、资料、规程、规定等调度管理信息系统中的各类数据资源,形成电网信息库,具备基于电力领域的全业务搜索能力,以自然语言作为输入对象,利用语义分析技术,提高智能搜索系统中文语句理解能力,构建电力系统调度领域全景本体库。电力系统调度领域全景本体库包含电力字典、名实体、调规等文本语料、录音等语音语料,为构建精准、智能的知识库提供原始数据支撑并不断进行扩充、完善。基于电力系统调度领域全景本体库,通过核心算法和学习训练,形成调控知识库、语言模型、意图识别模型等成熟知识库,为人工智能学习决策(感知、交互、思、行、学)提供知识来源。

电力调控领域相关业务数据中,含有特定的厂站、线路名称等大量的专有名称,同时也含有大量的监控信号、倒闸操作等方面的行业术语。搭建针对特定电网的电力语料规则库,是对调控业务数据进行语音识别的基础和关键。

5.1 根据电网中基础配置信息生成基础语料库

电力调控业务数据中,包含电压等级、设备类型等基础的配置信息,这类信息是文本分割、设备定位的基础元素,要根据这类数据各种可能的写法,生成基础语料库。

(1)电压等级:目前我国电网中包含1000kV、750kV、500kV、330kV、220kV、110kV、66kV、35kV、10kV、380V等不同的电压等级。在处理的过程中,还要考虑各种不规范写法的问题(比如字母大小写、采用汉字“千伏”等问题)。

(2)设备类型:电力数据文本中的设备类型信息,是定位、识别设备信息的关键。电网输变电设备中,包含变压器、母线、线路、开关、刀闸、电容器、电抗器、站用变、PT、CT、避雷器等多种类型的设备,每类设备又有不同的写法,需要将设备类型信息放到基础语料库中。

5.2 根据电网模型中厂站、设备信息生成模型语料库

电网模型中,包含厂站、线路名称、设备(开关刀闸等)编号等信息,需要根据特定电网模型,自动生成当地特有的模型语料库。随着电网模型的变化,模型语料库是需要持续更新的。为了应对信息命名不标准、不统一的情况,以上信息在入库之前,需要进行规范化处置。

5.3 根据各类业务生成不同专题的特定语料库

根据操作、检修、遥信等业务的分类及业务特点,生成不同专题特定的语料库。

操作术语语料库中,包含设备状态的命名,也包括各逐项令、综合令的术语描述。针对逐项令、综合令各类操作命令的语料规则中,不仅仅包含命令的关键字,还包含不规范关键字的变体、命令的解析规则等。

利用全景本体库,及其推理规则,实现结构化信息、非结构化信息、报表、应用程序功能模块等的精确搜索、模糊搜索、多轮对话式搜索。在日常调控操作中,利用机器学习不断自主完善电力语音、语料、规则库,具有良好的自更新性。[5]可实现的场景,例如:检索设备检修情况、设备操作情况、设备参数、各类规程、预案、语音调阅接线图等。

一般应用在电力领域的智能检索功能包括:

(1)多关键字组合模糊搜索;

(2)多条件组合搜索;

(3)前后语境的多轮对话式问答搜索;

(4)无需人工配置公式的数据库字段自动关联匹配精准搜索;

(5)搜索结果匹配度智能排序及自我学习,按登录用户权限、所管辖电网、专业习惯等进行搜索结果个性化输出。

6 结语

在人类社会中,最主要的沟通手段无疑是依靠听觉和视觉两种方式。在声音信息中语音是最常规的表达方式,它简单、自然、高效,伴随着科学技术的一次又一次的突破,人与机器进行交流变得更为方便、快捷。语音识别技术的应用范围极为广泛,不仅涉及到日常生活的方方面面,在电力领域也发挥着极其重要的作用,自动识别语音关键字并自动解析语义内涵,根据解析结果检索相应指令,进行电网各类运行管理数据的即时调阅帮助调度员处置辅助决策,为调度安全运行保驾护航。语音技术是信息社会朝着智能化和自动化发展的关键技术,使人们对信息的处理和获取更加便捷,从而提高人们的工作效率。

猜你喜欢
语料意图语料库
原始意图、对抗主义和非解释主义
陆游诗写意图(国画)
制定法解释与立法意图的反事实检验
《语料库翻译文体学》评介
基于语料调查的“连……都(也)……”出现的语义背景分析
华语电影作为真实语料在翻译教学中的应用
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
燕山秋意图