从智能语音助手角度浅析计算机智能科学与技术对电子设备交互的作用

2018-03-02 12:22徐鑫宇
数字技术与应用 2018年12期

徐鑫宇

摘要:今年以来,各大公司都推出了智能音箱产品,这种以语音进行操作的电子设备交互模式,一时间被大家广泛知道和使用。那么,智能语音到底对电子设备的交互起到什么样的作用呢?本文今天就从智能语音助手角度浅析计算机智能科学与技术对电子设备交互的作用。本文首先概述了智能语音及其原理,然后分析智能语音在电子设备交互中的应用,包括汽车智能交互、智能焦距、儿童终端、服务行业机器人四个方面。最后,还探讨了电子设备交互的未来发展趋势。

关键词:智能语音助手;电子设备交互;计算机智能科学与技术

中图分类号:TP30 文献标识码:A 文章编号:1007-9416(2018)12-0225-02

0 引言

2011年10月,苹果公司在美国加利福尼亚州举行的Let's talk iPhone的新品发布会上发布了iPhone 4s手机,一同发布的还有一个引发大众热议的功能——Siri语音服务。新购机的用户可以利用Siri通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等,一时间关于使用Siri的视频开始风靡网络,有了Siri的加持,手机也从一个通讯工具华丽变身为一个智能机器人。现如今,Siri的功能越来越完善,除了能帮助用户做一些辅助工作,俨然成为了很多果粉聊天解闷的忠实朋友。

Siri问世后,越来越多的语音助手软件开始进入我们的视野,比如百度地图中的小度、安卓手机中的各类语音助手、Windows 10 PC端的小娜、亚马逊的Alexa、小米的小爱同学等等,形形色色色的语音助手能为我们讲笑话、找电影、找餐厅,跟我们对话聊天等等。通过计算机智能科学与技术实现的智能语音助手已经成为信息时代下电子设备与用户之间新的交互方式。这种新方式解放了我们的双手、双眼,让我们能够在享受更多乐趣的同时,更加自如、安心地执行其他操作。接下来,我们将从智能语音助手角度简单地分析一下计算机智能科学与技术对电子设备交互的作用。

1 认识智能语音

1.1 智能语音发展史

最早实现语音识别功能的时间,我们要追溯到1952年。那一年,贝尔实验室制造了一台6英尺高的自动数字识别机“Audrey”,这个像人一样高的机器能够识别数字0~9的发音。接着,美国、日本的相关机构纷纷投入研究,虽然进展缓慢,但渐渐地机器开始能够识别简单的单音节词或者特定的元音。直到二十世纪七十年代,语音识别取得了突破性的进展,在美国国防部的支持及参与项目的相关机构努力下,研发出新一代智能语音识别系统Harpy,了不起的Harpy能够识别整句话。

二十世纪八十年代中期,IBM创造了第一台通过语音控制的打字机,当时这台打字机能够处理约20000个单词。1984年IBM又发布了一套智能语音识别系统,这套系统能够识别5000个词汇以上,并且准确率达到95%。

1987年12月,李开复开发出世界上第一个“非特定人联系语音识别系统”。

1988年,卡耐基梅隆大学开发出世界上第一个非特定人大词汇量连续语音识别系统。这个语音识别系统能够识别包括997个词汇在内的4200个连续语句。同年,清华大学和中科院声学所在大词库汉语听写机的研制上取得突破性进展。

电子信息时代的发展推动了智能语音识别技术的进步,进入二十一世纪后,大家对智能语音的思考方向更加开放,智能语音识别技术开始向更多的方向发展。

2001年,比尔盖茨通过MiPad原型机向世人展示了语音多模态移动设备的愿景。

2002年,由中科院自动化所及其所属科技公司推出的“天语”中文语音系列产品打破了语音识别领域被外国垄断的局面。

2006年,深度置信网络的提出掀起机器深度学习的热潮,2009年深度神经网络在小词汇量连续识别的应用上获得成功。

2011年,微软的DNN模型在语音搜索任务中获得成功,同年,科大讯飞成功将DNN应用到中文识别领域,并开放给开发者使用。

2011年10月,iPhone 4S发布,Siri同时面世,掀开了人机交互新篇章。自此各种各样的语音助手开始进入我们的生活,涉及领域越来越广。现如今我们随时可以见到智能语音的影子,应用场景非常广泛,诸如智能车载、智能家居、智能穿戴等等不一而足。

1.2 智能语音的基本原理

我们日常使用的工具大部分都需要用眼睛去看、用手进行操作,执行单一动作的时候我們的双手双眼还能够应付,但在现代生活中,很多时候都需要同时执行好几个动作。比如,开车的时候,如果需要按照导航走路,我们需要眼睛看路的同时看导航,手操作方向盘、离合器的同时还要操作手机。多个动作同时操作不但效率很低更重要的是非常的不安全,智能语音的出现帮我们解决了这个大问题。

智能语音主要通过自然语言识别来执行不同的操作,在不同场景的应用下能够为我们解决不同问题、满足不同需求。这种技术主要涉及到自然语言的识别与自然语言的生成两个方面。其识别机制其实不复杂,在我们与智能语音助手交流流时,后台系统首先会通过声学理论处理其它噪音减少干扰,同时以声波的形式摄取到人类的自然语言。摄取到声波被进行分帧处理,然后针对每一帧进行声学特征提取,将提取的部分按照不同波形特征转换成计算机能够读懂的语言。接着计算机对语音进行识别转化成文本,再通过语义理解技术对转化来的文字进行理解以确定用户所说的内容,再然后将数据发送到决策引擎,去执行用户的指令或通过语音合成技术把需要反馈的信息用语音的形式反馈给用户。

2 智能语音在电子设备交互中的应用

通过智能语音的发展史来看,自上个世纪80年代开始我国就已经开始了智能语音的研究工作,并长期得到国家的支持。随着相关技术的不断优化以及市场的不断推广,智能语音技术已经渗入到我们生活中的方方面面,涉及领域十分广泛,诸如汽车行业、家居行业、服务行业、娱乐行业等等,涉及的产品更是各式各样,人与各类电子设备的语音交互场景每天都在上演。

2.1 汽车智能交互

前文曾说到开车的场景,加入智能语音系统可以解放驾驶员的双手和双眼,提高驾驶的安全性,其实现在的智能语音系统早就不止这一个功能了,越来越多的互联网版车型的问世,给驾驶员的驾驶过程提供了很多帮助的同时也增加了很多乐趣。就拿东风日产的某款车来说,车载系统提供了智控导航、娱乐天气、通讯等200多种功能,能识别1000中日常语句。车主可以通过设置唤醒指令唤醒智能语音功能,而且常用的功能还能够免唤醒指令,直接说操作指令就可以。比如,车主想要出去吃饭,可以直接给出智能语音助手“吃饭”的具体指令,智能语音助手就能够为主人找出很多备选方案,待车主确定地点后直接导航到目的地即可。想要听音乐,可语音告诉智能语音助手打开播放器,切歌这种操作对它来说更是易如反掌的。

2.2 智能家居

物联网时代下的万物带给用户的直接体验就是便捷,作为方便我们生活解放我们双手的智能语音系统同样给我们创造的是便捷的生活方式。那么,作为我们最重要的生活场景,家居环境自然少不了智能语音的身影。随着市场推广、技术发展,融入智能语音技术的家居用品越来越多,前几年还需要通过手机连接才能实现控制的家电,现在直接用语音就能控制,甚至家居用品还能主动询问是否提供帮助。看一看家里的家用电器,最常见的配备了智能语音功能的应该就是电视了。比如小米的电视机,拿起遥控器按住Home键,对着遥控器说出你要看的电视剧或者电影名称,系统就会自动为你找到。还有小米出品的摄像头也加入了语音识别功能,只要你对着摄像头说一句“小白看过来”它就会听话地转过头来。

2.3 儿童终端

要说到智能语音应用领域中最重要的一部分就不得不提儿童终端市场了。无论从智能故事机、早教娱乐机还是儿童智能音箱,几乎每年都会出现爆款。之所以配备了智能语音系统的儿童终端这么受欢迎,源于智能语音系统的内置数据库及语音对话功能为父母创造了短暂的“闲暇时间”,哄得孩子不哭不闹的同时还能教会孩子知识,着实是父母的哄娃助手。就拿百度出品的小度智能音箱儿童模式来说,它内置百万级数据的儿童语言库,设置了儿童专用的语音唤醒模式以及语音识别交互引擎,确保孩子在于小度智能音箱对话的时候能够流畅自然,更重要的是它还拥有80万以上的精品儿童有声节目以及来自宝宝知道的10万以上的权威认证母婴问答内容。

2.4 服务行业机器人

前几天在网上的一个视频火遍了网络,视频中一位去银行办理业务的女士问正在岗位上工作的机器人:“你在这干嘛呀?”机器人回复:“上班呀。”女士又问:“工资多少钱呀?”机器人回答:“工资都用来付电费了。”这组对话着实可爱,更有不少网友留言说:“我就快下岗了。”确实,智能语音机器人已经可以成熟地服务于金融贷款、理财、房地产、电商行业,更能成熟地进行电话销售、客户服务、售后管理等基础岗位。尤其是线上的客服人员,已经被越来越多的智能语音系统代替,智能语音系统不但能够回答客户是问题,还能24小时不间断在岗,于企业而言确实更好管理。

3 电子设备交互的发展趋势

智能语音技术作为人工智能应用最成熟的技术之一,已经实现商业化落地,在智能家居、智能車载、儿童终端、服务等领域有了迅猛发展,从行业分析数据可以看出,在中国的人工智能市场规模的增长来看,智能语音居于重要位置。从技术水平来看,在语音识别率方面,百度、谷歌、科大讯飞等主流平台识别率均在96%以上,识别能力屈于稳定。同时语音对话时可随时打断,加入了语境分析功能。在自然语言生成技术上也达到了国际领先水平。智能语音发展的越来越好,但智能语音功能远远没有达到人类的理想水平,未来智能语音的价值点依然是以服务用户为主,深入挖掘用户数据,以语音作为物联网的入口,形成全新的商业模式。在智能家居、智能车载、智能穿戴等行业中发挥巨大的价值。

4 结语

智能语音系统经过60多么的发展,已经达到了能够让人与电子设备顺畅对话水平,实现了落实商业化用途的的目的,目前已经被广泛应用于我们的生活中。作为最早落地的人工智能技术,无论是产业模式、创新能力、应用能力还是企业能力,在人工智能领域都是发展最好的,都呈现出蓬勃发展的趋势。相信在国家的大力支持下,行业者的不懈努力下,以智能语音为首的计算机智能科学与技术在与其它产业融合、发展环境优化、技术公关等方面都会有更多利好消息,为物联网时代发展做出重大贡献。

参考文献

[1]宋伟,金畅.盛四辈.我国智能语音行业专利战略研究——以科大讯飞为例[J].科技进步与对策,2011,28(21):107-111.

[2]顾险峰.人工智能的历史回顾和发展现状[J].自然杂志,2016,38(3):157-166.

[3]朱斌.浅析智能语音技术及其应用[J].智富时代,2015(9):186.

[4]施超群,陈坚刚.浅析语音识别原理[J].浙江工商职业技术学院学报,2011(3):94-96.

[5]贾佩山.自然语言生成技术及其应用实例[J].电脑与信息技术,1997(2):7-9.

[6]白水.什么是自然语言处理(NLP)[J].语文建设,1992(2):37-37.

[7]刘剑.2017年中国人工智能行业分析——智能语音应用篇[J].湖南工业职业技术学院学报,2017,17(3):1-4.

Analysis of the Interaction Between Computer Intelligence Science and Technology on Electronic Devices from the Perspective of Intelligent voice Assistant

XU Xin-yu

(Xi'an Middle School, Shaanxi Province, Xi'an Shaanxi  710018)

Abstract:Since the beginning of this year, major companies have introduced smart speaker products. This interactive mode of electronic devices operated by voice has been widely known and used by people. So, what role does intelligent speech play in the interaction of electronic devices? This paper analyzes the role of computer intelligence science and technology in electronic device interaction from the perspective of intelligent voice assistant. This paper first summarizes the intelligent voice and its principles, and then analyzes the application of intelligent voice in electronic device interaction, including automotive intelligent interaction, intelligent focal length, children's terminal, and service industry robot. Finally, the future development trend of electronic device interaction is also discussed.

Key words:intelligent voice assistant;electronic device interaction;computer intelligence science and technology