基于智能手机的用户情感识别与调节模型研究

2017-11-27 12:15侯雄文

科教导刊·电子版 2017年29期

侯雄文

摘要智能手机的使用既给人们带来了巨大的自由与快乐，也造成了人们对于手机的依赖与孤独感。有鉴于此，为了减少用户在使用手机的过程中的情感孤独，研究提出一种基于智能手机情感识别与调节的模型。

关键词手机情感调节

中图分类号：TP399 文献标识码：A

手机作为“准第五媒體”，已经越来越多地融入到人们的日常生活。但是，手机的使用越来越使的人们变得孤独。为了使手机能够更好的服务于大众，我们提出一种基于智能手机情感识别与调节模型。利用手机使用过程中对人们语气、语速、某种感情色彩的词汇使用频率的检测，通过对应的数据匹配，从而高概率的判定手机用户当下的心情指数，通过对心情指数的直观识别，智能手机为用户提供人文关怀，如可以通过发送一些对应心情的图片、一些表示安慰或激励的句子，最终实现模型的目的。

1情感概述与人脸识别

情感是人对客观事物是否满足自己的需要而产生的态度体验。情绪感受有喜、怒、忧、思、悲、恐、惊等。情绪不同时人的面部、声音等会有不同的表现。

人脸表情识别（facial expression recognition，FER）中感情表露=7 %的言词+38%的声音+55%的面部表情。在智能手机中，我们可以采取下面的步骤，建立一个FER系统，首先需要对人脸进行检测与定位；其次从人脸图像或图像序列中提取能够表征输入表情本质的信息，在提取特征数据的过程中，需要特征降维、特征分解等进一步处理；最后分析特征之间的关系，将输入的人脸表情分类到相应的基本情感类别。在此，表情特征提取的方法是FER系统中最重要的部分，好的表情特征提取结果应该具备一下几个条件：

（1）完整的表示出人脸表情的本质特征；

（2）去除噪声、光照及其他与表情无关的干扰信息；

（3）数据表示形式紧凑，避免过高的维数；

（4）不同类别表情的特征之间有较好的区分性。

表情特征提取的步骤如下：

利用某种形式的信息来获得表情的原始特征，如特征形状与几何关系，局部纹理，光流场等，这一步骤成为原始特征获取。这些原始特征一般都存在信息冗余，维数过高，区分性不够等问题。所以需要对原始特征数据进行一些后处理，如特征降维和提取，特征分解等，以降低维数，去除干扰因素，得到对分类更为有利的特征数据。

常用的方法有：主元分析（PCA），线性判别分析（LDA），ICA等。

（1）PCA提取了最有代表性的特征，可以有效地消除冗余，降低维数，但没有考虑不同类别数据之间的区分性。

（2） LDA通过最大化数据的类间离散度和最小化类内离散度来选择合适的投影方向，侧重于寻找具有最大分辨力的方向。

（3）适用最广泛的是CMU的Cohn-Kanade数据库，算法比较标准。另外日本ATR的女性表情数据库（JAFFE）也得到较多适用。

某些表情易于识别，而某些表情不易识别，心理学方面的研究认为，最容易辨认的表情是快乐、痛苦，较难辨认的是恐惧、悲哀，更难辨认的是怀疑、怜悯，在FER系统中也面临着对某些类别的表情识别率偏低的情况。

目前的研究大多数都针对特定条件下采集的图像或者图像序列，但要做到对任意采集的图像或图像序列都不适应，还需要人脸检测等其他领域的发展。

2语音识别

语音识别主要包括以下内容：

2.1发音长度

通常，欢快、愤怒、惊奇的发音长度较短，平静发音长度居中，而悲伤的发音长度则稍长。

2.2语速

（1）从语速上看，欢快、愤怒、惊奇的语速较快，平静发音相语速居中，而悲伤则较慢。

（2）对于汉语而言，一个汉字即为一个音节，所以用总音节数除以持续时间即得到语速。

2.3音量

语音作为一种能量有限的信号，音量特征是其最重要的特征之一。从人们的直观感觉中就可感受到语音信号的音量特征与情感具有较强的相关性，如当人们愤怒时，发音的音量往往变大；而悲伤时，往往声音较低。

在语音识别环节主要包括：预处理、特征提取和情感分类。

2.3.1预处理

主要包括采样量化、预加重、端点检测、分帧加窗。

2.3.2 特征提取

特征提取的任务是从输入的语音信号中提取能够区分不同情感的参数序列。

2.3.3模式分类

（1）在训练时用反映情感特征的参数序列，为每种情感建立相应的情感模型。

（2）在测试或识别时根据所得到的待识别语音信号的特征参数序列，由系统对这些参数和已知情感模型之间的相似程度进行评估，并根据评估的结果判断输入语音信号的情感归属通过前面的处理以后，选择合适的算法也是一项重要工作，当前比较流行的算法有基于概率生成模型的方法和基于判别模型的方法两种。分别对应隐马尔可夫模型（HMM）、高斯混合模型（GMM）和支持向量机（SVM）、人工神经网络（ANN）。

3推送过程

前面的步骤完成以后，便是让智能手机将该模型识别了的情感模式推送给用户。其工作过程为：根据情感构造推送消息，后台服务器进行一些必要的处理工作（包括压缩、协议转换、安全认证等）。具体来说：如高兴时推送肯定、支持类的内容，以求锦上添花。如生活美好、感恩性质的图片、文字、铃声；忧伤时推送安慰、鼓励类的内容，特别在忧伤时未来还考虑可以在原有功能上再增加一个后台服务，向亲人（GF or BF）主动发提醒短信，提示对方给该用户打慰问电话。

然后通过将推送内容传送给客户端。客户端收到推送消息后，根据消息内容和服务类型同用户进行交互。用户可根据自身意愿、服务指示选择是否加载使用推送的相关服务。

4结语

当前，社会生活越来越多样化，工作压力也愈加突出，利用好智能手机不仅可以方便我们的社会生活，也能够使得智能手机的服务更加人性化，因此，基于智能手机的用户识别与调节模型的研究也更有实际意义。

参考文献

[1] Xu M&C Xu，etal.Hierarchical affective content analysis in arousal and valence dimensions.Singal Processing，2012.

[2] 赵力.语音信号处理[M].北京：机械工业出版社， 2009.

[3] 陈佳.语音信号情感识别[D].长沙：中南大学， 2008.endprint