语音识别导航技术综述

2018-10-08 01:41崔倩倩丁园园
科技视界 2018年22期
关键词:申请量专利申请语音

崔倩倩 丁园园 郑 岩 贾 乐

(1.国家知识产权局专利局专利审查协作河南中心,河南 郑州 450000;2.郑州市轨道交通有限公司,河南 郑州 450000)

1 概述

语音识别的研究工作大约开始于50年代,80年代进一步走向深入,标志是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。语音识别是将人类的声音信号转化为文字或者指令的过程。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支。语音识别的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域。

电子导航产品,是依托近几年发展起来的新兴的全球卫星定位系统和地理信息系统的先进技术而诞生的一类高科技电子产品。由于该产品基于庞大而复杂的地理信息系统数据,具有强大而又复杂的定位导航功能,包括:电子地图显示功能、电子地图信息查询功能、行车路线演算功能、行车导航功能、全球定位功能、车位自动校正功能等。同时由于该市场对产品的可携带性要求,此类产品本身尺寸较小,极其有限的人机交互界面,不能提供良好的人机交互性能,大大阻碍了此类产品在市场上的普及,进而也影响了定位导航的市场化,不利于此类产品在市场上快速普及。

美国从上世纪70年代开始研制全球定位系统(Global Positioning System,GPS),于 1994年全面建成的具有海、陆、空全方位实时三维导航与定位能力的新一代卫星导航与定位系统,其具有全天候、高精度、自动化、高效益等显著特点,因而在航空摄影测量、运载工具导航和管制等各方面都得到了成功地应用。来自太空的GPS卫星24小时免费向全球发送定位信号,使之成为定位导航应用中最方便廉价的信息源。用户通过用户终端接收GPS卫星信号,经信号处理而获得用户位置、速度等信息,最终实现利用GPS进行导航和定位的目的。

随着科技的发展和社会的进步,在人机交互中需要一种更加方便自然的方式,语音交互很好地满足了这种需求。因此,融合语音识别与导航定位的语音识别导航技术开始蓬勃发展,相关产品也层出不穷,极大地便利了人们的生活。

2 语音识别导航技术专利分析

为了研究语音识别导航技术的发展情况,本文使用利用分类号和关键词 (例如 “speech recognition”“navigation”“guidance”),通过在 DWPI数据库中进行检索来获得专利申请,以此为样本进行统计分析,本次检索的截止日期为2018年5月18日。

2.1 语音识别导航技术专利历年申请量分析

图1 历年专利申请数量分布

将以上获得的专利文献进行统计分析,得到其历年专利申请数量的分布趋势。从统计结果可以看出,相关申请从1982年开始出现,国外从事相关方面技术研究较早。由于在1982-1989期间无论是国内还是国外都处于专利申请起步阶段,全球申请数量均为个位数。因此,本文截取了1990-2017年期间的历年专利申请数量的分布趋势进行研究,如图1所示。从图1可以看出,直到20世纪90年代中期开始,中国开始出现语音识别导航相关专利申请。从2000年起至2008年,国内相关专利申请进入缓慢增长期,而国外相关专利申请在1994-2008年已经进入了相对快速的增长期。从2009-2016年,随着人工智能即自然语言的理解相关技术在各方面的发展与应用,以及各国对专利布局的重视程度日益增加,基于语音识别导航方面的专利申请数量在国内外都迅速增长。2017年,全球以及中国的专利申请数量都有所回落,也体现出语音识别导航技术在国内外以及逐渐迈入成熟阶段。

2.2 专利申请分布概况

图2为全球专利申请国别申请量分布图,从全球专利申请国别分布可知,基于语音识别导航技术相关专利申请人分布范围较广,主要有日本、中国、美国、韩国等。作为互联网及通信行业的传统强国如日本、美国,在语音识别导航相关领域在国内申请了大量的专利,其中日本依托强大的信息技术产业,申请量占全球总量的29%,位居第一;我国近年来互联网技术不断迅猛发展,申请量紧随日本之后,申请量位居第二,占全球申请量的24%,再次是美国。

图2 全球专利申请国别申请量分布

2.3 重要申请人分析

对基于语音识别导航技术相关专利申请人进行统计分析,通过国内外公司在中国专利申请量的对比可知,全球主要的申请人主要集中在日本的企业,且国外相关企业具有较高的专利布局意识,在中国申请了大量专利。全球主要申请人有日本电装公司、三菱电机公司、日本汽车公司、松下电器产业以及阿尔派株式会社。在国内有关语音识别方面的专利申请以互联网公司为主,国内的主要申请人有深圳市赛格导航科技股份有限公司、神达电脑股份有限公司、广东翼卡车联网服务有限公司、国家电网公司、百度在线网络技术(北京)有限公司、中兴通讯股份有限公司、青海汉拉信息科技股份有限公司。

3 重要专利分析

最早公开的语音识别在导航方面应用相关的申请主要致力于如何提高对输入语音地准确识别以及对语音字的连续流中的关键字序列进行识别的研究中,主要是侧重于对输入形式进行改进,对于地图导航界面的显示并未作出改变,处于初级阶段。公开号为CN1324740A、CN1674091A、CN1841312A的专利申请均是基于拼音字符串的相近匹配度,从中得到最大相近匹配度的源串为语音识别的结果字符串即需要查询的地理信息名称。之后的发展对语音识别的效果提出了更高的要求,如何使导航可以更容易地理解用户输入的语音成为研究的主要方向。公开号为CN101136198A可以检测上述说话者的视线方向,推测在该视线方向的视觉确认对象物,然后选择与说话者发出的语音相似程度高的识别候补。CN102324035A把口型辅助语音识别技术应用在车载导航系统中,从而提高语音识别率,尽可能避免驾驶员操作导航设备时发生安全事故。

为了进一步降低驾驶车辆时的因司机转移视线而导致的危险,以语音输出的形式进行播放导航路线信息也快速衍生出来。 公开号为 CN101158584A、CN101196400A都实现了在行车过程中只需通过驾驶员发出语音指令即可使导航系统自动向目的地导航的目的,最后以语音形式输出进行导航,解放了驾驶员的双手,大大地方便了驾驶人的操作。

语音导航技术的发展也逐渐惠及到生活中的各个方面,如对有视觉障碍的特殊人群的辅助导航作用、多功能后视镜语音智能导航夜视行车记录仪等。公开号为CN101799299A、CN102274109A的专利均提出了一种帮助视觉障碍人士使用的导航设施和方法,通过特定的路径键和语音提示帮助用户输入起点和终点而后进行语音导航。在物联网领域可以更及时方便地整合资源实现语音现场集群控制能自动导航的驱动器的方法。公开号为CN106527156A的专利提供了一种汉语语音现场集群控制能自动导航的驱动器的方法,可以实现汉语语音现场集群控制能自动导航的驱动器的方法。

4 结论

目前,语音识别导航技术虽然已经发展得比较成熟,在日常生活与科学研究中也得到了较好的应用。语音导航技术的发展过程主要包括提高语音识别准确度、提高输入输出接口的用户体验、发掘用户兴趣点以及特殊需求等多个阶段方向。但是随着人们需求的不断变化,个性化服务的呼声越来越高,因此,融合用户各方面需求的语音识别导航可能继续成为日后的研究热点,以更好地满足人们多样化、个性化的需求。

猜你喜欢
申请量专利申请语音
我国农业植物新品种权申请量超5万年
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
138.2万件,发明专利量质齐升企业占大头
2016年英国外观设计申请量增加55%
专利申请审批流程图
专利申请三步曲
国外专利申请如何尽快被授权