基于随机森林和行为相似性的老人居家行为识别方法

2019-12-05 08:35潘宇欣郑彬张龙于鹏飞徐汉川
智能计算机与应用 2019年5期
关键词:随机森林

潘宇欣 郑彬 张龙 于鹏飞 徐汉川

摘 要:在居家养老服务中,如何获取老人居家活动,是精确主动为老人提供居家服务的关键问题。本文以居家养老服务为研究背景,首先分析了居家养老服务中活动的类别,以及各类活动所包含的行为。然后建立了老人居家行为识别问题模型,阐述了使用情境感知技术来获取老人行为的解决思路,进而提出了基于随机森林和行为相似性的两层行为识别算法。最后通过大量实验验证了算法的正确性与性能。本文提出的行为识别算法能够准确识别老人行为,其准确率可达到95.59%,效果优于同类其它方法。

关键词: 居家养老服务;情境感知;行为识别;随机森林;行为相似性

【Abstract】 In home-based care service, how to precisely obtain behaviors of the elderly is a key issue to provide high-quality home services for them. Thus, this paper studies the types of activities in home-based care service and the relationship between activities and behaviors. Afterwards, the paper proposes a model of behavior recognition for the elderly at home and decides to use context-aware techniques to obtain the behavior of the elderly. Then, a two-layer behavior recognition algorithm based on Random Forest and behavioral similarity is proposed. Finally, the paper conducts a series of experiments to show the correctness and performance of the algorithm. The proposed algorithm for elderly people in this paper can accurately identify the behavior, and the accuracy rate is over 95.59%, which is better than other methods.

【Key words】  home-based care service; context awareness; behavior recognition; Random Forest; behavioral similarity

0 引 言

全球面临着人口老龄化问题,空巢老人群体逐渐增多,养老问题日益严重,中国政府大力发展养老服务产业,其中居家养老的发展能够有效地解决老人的大多不便和困难,并有效缓解社会养老机构不足的问题。物联网技术和服务计算技术的结合,能够更精准地感知老人的需求,以提供更优质快捷的服务。老人群体中的显式需求易于获得,隐式需求则需要利用物联网中的情境感知技术。一般来讲,情境感知计算包含4个基本步骤,分别是:情境获取、情境建模、情境推理和情境分發。其中,情境获取过程处于整个情境感知的最初阶段,其准确度影响后续过程,是十分重要的一环。通过各类传感器可以获取大部分情境信息,但仍然不足以完全支持对老人行为的准确识别。

行为信息获取中的一项重要支撑技术是对人体行为的感知识别技术,从而使其能根据老人的行为来提供服务。行为识别可以被视为模式识别的一个热门分支。传统的模式识别方法已经取得了巨大成就,采用机器学习算法对人类行为进行分类预测,例如决策树、支持向量机、朴素贝叶斯、隐马尔可夫模型等[1-2]。但是现有研究中仍然存在问题:大部分研究没有关注行为存在的多样性与相似性的特点。很明显,因为每个用户都是个性化的,不同用户在做相同行为时是不同的,同一用户的同种行为由于受到诸如压力、疲劳程度、情感状态、环境因素等在内的一些因素影响,也会有差别,表现出多样性。但同时多个行为间又具有相似性,容易混淆。而这些是影响识别准确率的重要因素。

因此,本文以居家养老服务为背景,针对现有技术的不足,提出一种基于随机森林和行为相似性的两层老人居家行为识别算法,实现老人居家行为信息的准确获取。对此拟做研究论述如下。

1 相关工作

解决老年人的日常安全与看护问题,是行为识别研究的一个主要目的与应用方向。文献[3]提出了一种层次行为识别系统来识别独居老人生活中的异常活动(如胸痛、头痛、呕吐、晕厥等)。通过自动定期监测系统来确保老人的安全,并改善独居老人的生活质量,降低医疗保健成本。文献[4]则关注老年人日常活动,有助于医生或家人了解其活动规律及运动量,提高医生对健康评价的准确性,以制定更合适的康复治疗策略。文献[5]设计一种采用 3轴加速度传感器和陀螺仪的可穿戴式摔倒识别、报警系统,以监护老年人活动、及时用手机报警,能迅速开展摔倒后的救助工作。文献[6]提出了一种基于可穿戴式投影仪的步态辅助系统,老年人走路时,系统识别步态姿势并会在地上投影出预期位置,有效但低成本地帮助老年人步行。

在识别方法上,根据传感器数据定义活动的表示,传统方法多是分为2类。对此可得阐释分述如下。

(1)基于逻辑。要监视的每个行为都有明确的规则编码,即相关参数的允许值的范围。大多数采用基于逻辑的方法的系统使用决策树,通过逐步缩小可以表示的行为范围来对数据进行分类[7]。

(2)基于概率。每个行为都通过一个模型来表示,通过在存储的模型中使用传感器数据进行概率距离度量比较来进行分类。大多数解决方案采用隐马尔可夫模型[6,8]或高斯混合建模[9-10]。

实验时,将数据集随机分成4种规模的数据集,即:数据集1(原数据集的四分之一)、数据集2(原数据集的四分之二)、数据集3(原数据集的四分之三)、数据集4(原数据集大小)。分别在这4种规模的数据集下进行实验,从特征数对算法的影响以及行为相似性提高算法的性能角度分析本文算法性能,并将本文算法与原数据集算法进行算法性能的对比分析,以及与其它机器学习算法进行对比分析验证随机森林算法的优越性。

4.2 评价指标

基于随机森林的老人行为算法的性能使用准确度(Accuracy)、Kappa系数和均方根误差(Root mean squared error,RMSE)这3个性能指标进行评估。研究推得性能指标的定义概述如下。

4.3 算法性能分析

为了证明随机森林(Random Forest,RF)的优越性,同其它相关分类算法对比,选择多层感知机MLP(Multi-Layer Perceptron)、决策树中的J48、朴素贝叶斯NB(Naive Bayesian)、贝叶斯网络BN(Bayesian Network)、和支持向量机SVM中十分流行的序列最小优化SMO(Sequence Minimal Optimization)算法等方法进行实验,分别采用10-折交叉验证的方式运行各方法50次,计算各种方法的准确率、Kappa系数和均方根误差性能指标均值。各方法性能对比如图4所示。

从图4可见,在所有数据集下,随机森林的老人行为识别的准确率最高,Kappa系数也最高,同时其均方根误差最低。随机森林的优越性主要体现在这是一种集成学习的方法,结合多个决策树的结果而决策出推理结果。因此,本文选择随机森林算法作为初步识别老人行为方法。

在机器学习中,特征的选择十分重要,本文的特征是基于统计学进行选择,候选特征有最大值、最小值、平均值、标准差、四分位数-Q1、四分位数-Q2、四分位数-Q3、众数、极值差、平均值個数、中程数、变异系数、方差、偏态、峰态等。本文初步探索特征对算法准确率的影响,通过不同的特征组合运行算法,在4种数据集上运行,得出不同特征提取下的基于随机森林的老人行为算法的平均准确率如图5所示。

从图5可知,当特征数逐渐增多时,算法的准确率逐步提升,但特征数达到一定数目时,算法的准确性达到峰值,即特征数为11时效果最好,此后选取的特征数再增加时,算法的准确率不变。随着特征数的增加,算法耗时也有所增加。因此,选取合适的特征数及特征组合既能够保证准确率,又能减低算法耗时。

在对数据集数据进行预处理,提取特征后,使用训练集进行模型训练,再使用测试集测试算法。其中,数据1算法准确率为92.31%,相应的混淆矩阵如图6所示。

从图6可知,躺下行为容易判断成其它行为,如梳头、散步,刷牙容易推断成梳头、起来、坐下等。根据位置和行为的相关性,通过分析随机森林的混淆矩阵,设置位置行为相关值,利用行为相似性来校验老人行为,进而准确更正识别的行为。与此同时,在数据集1上运行算法50次,对每种行为识别的准确率取平均值,得出本文算法与未使用行为相似性的随机森林算法的每种行为准确率对比如图7所示,2层算法的行为识别的平均准确率为95.59%。

从图7可知,随机森林算法中老人行为中的刷牙、散步、喝水、倒水、躺下、吃饭等行为的识别准确率较高,坐下和起床的行为识别准确率较低。随机森林算法每种行为识别的准确率不同,在引入行为相似性后,通过位置时间与行为关联性的检验以及通过行为相似性来更正行为,能够提高普通行为识别准确率,尤其是起床行为。

将本文算法在4种规模数据集上进行多次试验,得到算法的平均性能如图8所示。

从图8中可知,随着数据规模的增大,算法的准确率会提升,但是数据规模达到一定程度后,数据的准确率并不会增加。

ADL数据集采集者Dyana提出了一个识别行为的框架[19],依靠高斯混合回归建立活动模型,具体为基于马氏距离利用GMM和GMR建模的特性来实现简单的运行时识别,该方法识别了7种人体运动。本文方法与数据中使用的方法进行对比,结果如图9所示。

由图9中可知,本文方法准确率高于Dyana提出的方法,并且可识别的行为比原数据方法多。通过分析,可能的原因有3点,具体表述如下。

(1)本文采用多个统计特征值,比单一数值更能反映数据表达的含义。

(2)本文使用随机森林方法,集成多个模型采用投票的方式判断行为,比纯粹的单一数学模型的识别效果要好。

(3)本文利用行为的相似性进一步更正行为,能够消除个别行为识别率低的情况,这种方法进一步提高了算法整体的准确率。

5 结束语

本文以居家养老服务为背景,通过使用基于随机森林和行为相似性的两层老人居家行为识别算法实现了老人行为情境信息的获取,并通过实验与分析,挑选了11个统计学特征,在算法准确率为92.31%的随机森林上、接着又引入行为相似性后进一步提升至95.59%,证明了通过位置时间与行为关联性的检验以及行为相似性更正行为,能够提高普遍行为识别准确率。本文的后续工作可概述为如下2个方面,即:

(1)扩展问题模型,增加获取的传感器数据类型和规模,以进一步提升识别准确率和适用范围。

(2)将识别算法同老人居家需求的推理以及服务主动提供技术相结合,实现更深层次的应用。

参考文献

[1]RAVI N, DANDEKAR N, MYSORE P, et al. Activity recognition from accelerometer data[C]∥ The Twentieth National Conference on Artificial Intelligence and the Seventeenth Innovative Applications of Artificial Intelligence Conference. Pittsburgh, Pennsylvania, USA:AAAI, 2005, 3:1541-1546.

[2]RANA J B, SHETTY R, JHA T. Application of machine learning techniques in human activity recognition[J]. arXiv preprint arXiv:1510.05577, 2015.

[3]KHAN Z A, SOHN W. Abnormal human activity recognition system based on R-transform and kernel discriminant analysis for elderly health care[J]. IEEE Transactions on Consumer Electronics, 2011, 57(4):1843-1850.

[4]汪成亮, 王小均. 基于三軸传感器的老年人日常活动识别[J]. 电子学报, 2017, 45(3):570-576.

[5]吴天昊. 基于3轴加速度传感器及陀螺仪的老年人摔倒识别[D]. 北京:北京工业大学, 2013.

[6]MURATA S, SUZUKI M, FUJINAMI K. A wearable projector-based gait assistance system and its application for elderly people[C]∥ Proceedings of the 2013 ACM International Joint Conference on Pervasive and Ubiquitous Computing. Zurich, Switzerland:ACM, 2013:143-152.

[7]MINNEN D, STARNER T, WARD J A, et al. Recognizing and discovering human actions from on-body sensor data[C]∥Proceedings of the 2005 IEEE International Conference on Multimedia and Expo (ICME' 05). Amsterdam, The Netherlands:IEEE, 2005:1545-1548.

[8]KRASSNIG G, TANTINGER D, HOFMANN C, et al. User-friendly system for recognition of activities with an accelerometer[C]∥Proceedings of the 2010 International Conference on Pervasive Computing Technologies for Healthcare (PervasiveHealth'10), Munich, Germany:dblp, 2010:1-8.

[9]CHOUDHURY T, CONSOLVO S, HARRISON B, et al. The mobile sensing platform: An embedded activity recognition system[J]. IEEE Pervasive Computing Magazine, 2008,7(2):32-41.

[10]RASMUSSEN C E, WILLIAMS C. Gaussian processes for machine learning[M]. Cambridge, MA, USA: MIT Press, 2006.

[11]朱煜, 赵江坤, 王逸宁,等. 基于深度学习的人体行为识别算法综述[J]. 自动化学报, 2016, 42(6):848-857.

[12]HA S, CHOI S. Convolutional neural networks for human activity recognition using multiple accelerometer and gyroscope sensors[C]∥ 2016 International Joint Conference on Neural Networks(IJCNN). Vancouver, BC, Canada:IEEE, 2016:381-388.

[13]KAR A, RAI N, SIKKA K, et al. AdaScan: Adaptive scan pooling in deep convolutional neural networks for human action recognition in videos[J].Computer Vision and Pattern Recognition (CVPR). Las Vegas, Nevada, USA:IEEE,2016:3376-3385.

[14]LEE S M, YOON S M, CHO H. Human activity recognition from accelerometer data using Convolutional Neural Network[C]∥ 2017 IEEE International Conference on Big Data and Smart Computing(BigComp).Jeju, South Korea: IEEE, 2017:131-134.

[15]HAMMERLA N Y, HALLORAN S, PLTZ T. Deep, convolutional, and recurrent models for human activity recognition using wearables[J]. Journal of Scientific Computing, 2016, 61(2):454-476.

[16]EDEL  M, KPPE E. Binarized-BLSTM-RNN based human activity recognition[C]∥ 2016 International Conference on Indoor Positioning and Indoor Navigation(IPIN). Alcala de Henares, Spain:IEEE, 2016:1-7.

[17]CHEN Yuwen, ZHONG Kunhua, ZHANG Ju, et al. LSTM networks for mobile human activity recognition[C]∥ International Conference on Artificial Intelligence: Technologies and Applications. Bangkok, Thailand:Atlantis Press, 2016:50-53.

[18]BRUNO B, MASTROGIOVANNI F, SGORBISSA A. A public domain dataset for ADL recognition using wrist-placed accelerometers[C]∥The 23rd IEEE International Symposium on Robot and Human Interactive Communication(2014 RD-MAN). Edinburgh, UK:IEEE, 2014: 738-743.

[19]BRUNO B, MASTROGIOVANNI F, SGORBISSA A, et al. Analysis of human behavior recognition algorithms based on acceleration data[C]∥ IEEE International Conference on Robotics and Automation. Karlsruhe, Germany:IEEE, 2013:1602-1607.

猜你喜欢
随机森林
随机森林算法在中药指纹图谱中的应用:以不同品牌夏桑菊颗粒指纹图谱分析为例
基于随机森林的登革热时空扩散影响因子等级体系挖掘
基于随机森林的HTTP异常检测
个人信用评分模型比较数据挖掘分析
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
基于随机森林算法的飞机发动机故障诊断方法的研究
基于奇异熵和随机森林的人脸识别
基于随机森林算法的B2B客户分级系统的设计