语音识别技术在智能家居中的研究与应用

2016-05-16 12:52姜辰凯

企业文化·中旬刊 2016年5期

姜辰凯

摘要：随着人类社会的进步和科学的迅猛发展，人们开始追求智能、便捷的家居环境，因此智能家居得到迅速地崛起。本为主要以NL6621嵌入式硬件和软件为平台，VS1003为音频解码芯片录制语音。并利用隐马尔可夫（HMM）算法进行语音模型训练和语音匹配，实现智能家居语音控制系统。

关键词：智能家居；语音识别；模式识别；嵌入式系统

智能家居系统是以家庭住宅作为系统的基本应用平台，利用计算机通信、模式识别、自动控制等技术将家居生活中有关的设备进行有机的结合，构建出一套高效、智能的家居自动控制和管理系统。

本文以智能家居为背景，将语音识别技术应用于智能家居环境中。通过语音技术识别出短语命令从而进行家居设备的控制，建立起一套便捷、智能的家居智能控制和事务管理系统，使系统更加智能化。

研究的意义：科技让生活更智能，语音让交互更便捷。无论是再技术先进的品牌，再友善的人机交互界面，都没有语音交互控制来的简便直接.所以，如果智能家居能与语音交互融于一体，那么智能家居产业也许会迎来一次划时代的突破。

一、语音识别与智能家居

随着智能家居市场的发展，国外的IT巨头们已先后以智能家居与语音相结合的方式进入智能家居领域：谷歌收购NEST布局智能家居，不断强化Google Now的语音入口；苹果HomeKit智能家居平台与Siri也不断加强融合；市场上流行的Echo智能音箱使用了亚马逊的Alexa语音技术；微软也发布语音助手Cortana，将它作为智能家居领域扩展交互入口。从这些国外科技大佬们对语音产业的重视和投入，可以看出智能语音与智能家居的融合是大势所趋，业内普遍认为语音作为人类信息最自然、最便捷的交互方式，必将成为未来智能家居设备中的重要组成部分。

（一）语言识别技术

语言识别技术也被称为自动语音识别Automatic Speech Recognition，（ASR），其目标是将人类的语音中的词汇内容转换为计算机可读的输入，与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合，可以构建出更加复杂的应用，语音识别技术正逐步成为计算机信息处理技术中的关键术.语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

（二）语言识别算法

目前具有代表性的语音识别方法主要有动态时间规整技术（DTW）、隐马尔可夫模型（HMM）、矢量量化（VQ）、人工神经网络（ANN）、支持向量机（SVM）、独立分量分析（ICA）等方法。

1.动态时间规整算法（DynamicTimeWarping，DTW）是在非特定人语音识别中一种简单有效的方法.该算法基于动态规划的思想，解决了发音长短不一的模板匹配问题，是语音识别技术中出现较早、较常用的一种算法。

2.隐马尔可夫模型（HMM）是语音信号处理中的一种统计模型，是由Markov链演变来的，所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练形成的与训练输出信号吻合概率大的最佳模型参数而不是预先储存好的模式样本，且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出，因此是较理想的语音识别模型。

3.矢量量化（Vector Quantization）是一种重要的信号压缩方法。与HMM相比，矢量量化主要适用于小词汇量、孤立词的语音识。

4.人工神经网络（ANN）本质上是一个自适应非线性动力学系统，模拟了人类神经活动的原理，具有自适应性、并行性、鲁棒性、容错性和学习特性，其强大的分类能力和输入-输出映射能力在语音识别中都很有吸引力。

5.支持向量机（Support vector machine）是应用统计学理论的一种新的学习机模型，支持向量机由于它具有良好的理论基础，所以在各个领域中得到广泛应用，使用支持向量机对说话人进行建模也在最近几年得到许多研究。

二、基于NL6621嵌入式硬件设计

语音识别的硬件平台主要包括中央处理器NL6621，可读写存储器，声卡芯片vs1003以及一些外围设备，主系统使用新岸线公司的NL6621。MCU采用的最高主频为160MHz，支持802.llb/g/n/i/e/p和Wi-Fidirect，BSS STA，软AP，Wi-Fi保护设置以及WMM-PS和WPA/WPA2安全协议。codec芯片是vs1003，它与核心控制器NL6621的数据通信是通过SPI总线方式进行的。它集成了麦克风输入接口，音频输出接口，对话筒输入或者线路输入进行IMA ADPCM编码，能有效的接受和播放音频信息。

三、基于NL6621嵌入式软件设计

软件设计主要包括两部分实现软件控制嵌入式系统和基于HMM技术的语音识别算法编写，针对嵌入式系统控制部分，包括硬件初始化以及采集音频信号。主要是使用NL6621提供的软件开发包，利用SDK编写应用程序，包括硬件管脚初始化，波特率匹配，录音文件配置，Wi-Fi配置，录音，音频文件格式转化、程序编写完成后需要用烧写工具进行烧写。然后系统开始工作，通过语音输入设备MIC采集语音，并通过声卡VS1003输入语音。

四、结束语

本文通过设计了一个简单嵌入式语音平台，并以实验验证了其语音识别的有效性及可行性。将程序下载到NL6621平台上运行实现语音传入，相信对智能家居中嵌入式语音控制开发具有一定的意义。我们仍要通过不断研究并设计更加可靠方便的系统，从而使智能家居语音识别走向更成熟的市场。

参考文献：

[1]张雄伟.现代语音处理技术及应用[M].北京：机械工业出版社，2003.

[2]赵力.语音信号处理[M].北京；机械工业出版社，2009.

[3]顾亚强.非特定人语音识别关键技术研究[D].长沙.国防科学技术大学硕士学位论文，2009.

[4]杜晓伟.嵌入式语音识别的研究与实现[D].北京.北方工业大学信息工程学院，2011.

[5]刘荣辉.基于智能家居控制的嵌入式语音识别系统[J].广州.广东工业大学学报，2014.