视频会议系统智能语音识别技术应用研究

2020-08-04 09:50袁方
数字技术与应用 2020年5期
关键词:视频会议高效

袁方

摘要:目前,视频会议系统在各大公司均得到了广泛应用,5G网络时代的到来,各公司对视频会议的服务效率要求也越来越高。但现有的视频会议系统还存在智能化程度不高、延时较大、操作不灵活等状况。本课题通过开发运用智能语音识别系统设备,实现与既有视频会议系统人性化交互,优化会议控制功能,进一步提升了视频会议系统的服务效率和运用质量。

关键词:智能语音识别;视频会议;高效

中图分类号:TN912.34 文献标识码:A 文章编号:1007-9416(2020)05-0049-02

1概述

1.1背景

近年来,随着大规模通信网络建设和既有通信网络的更新改造,视频会议系统已逐步建成并陆续扩大。但现有的会议系统网管对于已组会的会议控制方式仍然是以文字界面为主,对会议的控制尤其是根据需要对于特定会场进行点名是非常不便的,严重影响了会议进行的效率。如何更有效地组织管理规模较大的视频会议、提高会议系统服务效率,已经成为了亟需解决的难题。

1.2目标

(1)开发运用语音识别系统设备,实现会场语音的智能识别;

(2)实现语音识别系统与既有视频会议系统的对接,进而实现通过语音识别来智能地切换会场画面,加快会议点名的效率。

通过以上改进,优化视频会议系统的会议控制功能,满足視频会议召开时的会场点名时间要求,并方便网管操作人员的实际操作,提高视频会议系统的服务质量和开会效率。

2研究内容及技术方案

2.1研究内容

(1)语音采集:通过在终端设备上增加语音采集设备,采用端点检测、语音增强和维纳滤波技术,消除噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。

(2)语音实时识别:应用先进的深度学习算法,实时的把各角色的发言的语音做识别处理。

(3)关键词检索及关联:在处理各角色的发言语音中过滤、筛选出相关的关键词。

(4)实现与既有视频会议系统的交互:在处理各角色的发言语音时,通过过滤、筛选出相关的关键词,针对不同的关键词设计相关的交互动作。

(5)开发新会议点名控制界面:优化操作,固定网管系统会议会场列表中各会场的排列方式,并根据会场终端的连接状态确定网管上终端的显示方式,便于网管系统操作人员进行操作。

2.2技术方案

业务流程:语音识别系统一般包括预处理、特征提取、语音识别模型训练、模式匹配以及后语音处理等主要处理流程,这几个主要处理流程分别介绍如下:

(1)预处理。待识别的原始语音信号一般在所有处理之前需要先进行预处理,并对其实施预加重和分帧等处理,预处理的目的是为了提高语音信号的质量,将原始信号处理成适合计算机处理的信号,以便为后续的处理工作做准备。

(2)特征提取。该过程先将通过分析预处理后的语音信号,得到反映该信号的一些特征,然后利用这些特征,得到对应的特征参数,即获得可以表示该语音信号实质的参数。

(3)语音识别模型训练。从语音样本数据库中提取每条样本语音的特征参数,通过学习算法,利用样本语音的特征参数在学习过程中不断优化模型进而形成较为完善的语音识别模型。

(4)模式匹配。将从待识别语音信号中提取出的特征参数与已训练好的模板库中的参考模板进行匹配,得到最佳匹配结果,即获得识别结果。

(5)后语音处理。利用语言学和机器学习等有关技术和知识,从语法和语义层面,对识别结果进行分析,使识别结果更加准确,从而提高语音识别系统的性能。

本系统在原有的流程上增加交互设计,具体的业务流程操作如下:

(1)通过在原来的会议系统的调音台上分出其中一路音频接入到语音识别交互系统中,完成整个语音的接入。

(2)通过对原会议系统实时语音和历史语音数据进行多场景模型训练,原始语音采样量化、信号处理和特征提取及标注后,完成具有声学与语言模型训练针对性的语音识别模型、语义理解模型和会议专业知识库。

(3)现场语音识别交互系统对接入的实时语音数据完成相应的识别、关联及理解,并将语音流所属会议信息入库。

(4)根据实时语音会议分析结果向原会议系统发送控制交互请求,原会议系统根据已经定义的接口数据内容自动完成交互动作,如图像界面的切换等。

(5)也可以使用人工模式,采用新版本的模块化设计控制界面和点面界面,实现会议控制和点名等操作的高效性。

3设计方案

3.1设计原则

(1)系统安全性原则:系统安全性是信息系统建设的基础,因此需要通过使用必要的安全机制,如:PKI身份认证、数字签名(CA)、用户访问控制、身份鉴别、收发确认、数据过滤、业务流量分析、权限控制等手段,提供可靠的安全管理措施以便保护系统安全。

(2)标准化原则:遵守国际和国内的有关系统建设方面的标准,按照规范的开发流程进行系统设计、开发。

(3)耦合性原则:耦合性是度量一个程序结构中各个模块之间相互联系的程度,它是影响软件复杂程度的一个重要因素。系统在设计中要充分考虑与其它系统之间的数据交换,达到资源共享。要求系统采用符合业界标准的数据传输格式,进行数据交换。

(4)易用性原则:依据全面的用户需求调研和专家分析结果,开发浏览器版系统,具有强大的数据处理以及业务管理功能。采用灵活的互动式的功能设计和界面设计,既体现了现有的业务流程又方便使用人员的操作,又实现了功能性和易用性的统一。

(5)开放性原则:系统开放程度直接影响到系统的生命周期。系统真正符合三层浏览器/服务器(B/s)体系结构,考虑到良好的扩充性。根据未来业务的增长和变化,要求系统可以平滑地扩展和升级,无需变动系统架构和现有设备。

(6)先进陛原则:采用目前成熟、先进的软硬件技术,在满足性能指标的前提下,选择目前世界上知名厂家的成熟产品,提供最佳的解决方案。

3.2网络系统设计及思路(如图1)

4项目总结

本项目在原有的会议系统上增加了基于智能语音识别功能,在处理各会议角色的发言语音中过滤、筛选出相关的关键词,实现了针对不同的关键词设计相关的交互动作的目的。

在语音识别自动控制的功能上兼顾手动模式,开发利用视频会议系统网管软件,设计新会议点名控制界面,增加会场列表图形化会议控制功能模块,并固定网管系统会议会场列表中各会场的排列方式,并根据会场终端的连接状态确定网管上终端的显示方式,实现利用网管系统对正在召开的会议进行图形化界面控制,便于网管系统操作人员进行操作,切换等待时间由原来的8-12秒缩短为2-4秒。

猜你喜欢
视频会议高效
省农办主任暨三农重点工作推进视频会议
民政部召开民政领域社会工作推进视频会议
全省水利工作视频会议召开
为小语课堂“瘦身”,为学生语文素养增“肥”
提高提问的有效性, 构筑高效的语文课堂
打造务实、创新、高效的语文课堂
浅谈远程视频会议系统的构建