基于相位同步与AR的运动想象脑电信号特征提取研究

2018-03-26 02:14刘琳琳陈健李松
软件导刊 2018年3期
关键词:支持向量机

刘琳琳 陈健 李松

摘要:运动想象脑电信号的特征提取对脑-机接口研究者是一大难题。针对该问题,介绍了一种相位同步和AR模型系数相结合的特征提取方法。该方法对采集的脑电信号进行Hilbert变换计算脑电信号的相位同步特征,选用Burg算法对滤波后的脑电信号进行AR模型谱估计,比较6阶和8阶功率谱密度,求出AR模型的系数为6。采用支持向量机对两种特征组合的14维特征向量进行分类。分类结果显示在Trail的3s~7s期间,相位同步与AR模型系数相结合的特征提取平均分类正确率为82.58%,最高分类正确率达到了88.96%,优于传统的小波变换和共空域模式特征提取方法。实验结果也表明相位同步特征提取的最佳时间为Trail的3s~7s期间,该方法为BCI研究运动想象脑电信号的分类识别提供了有效手段。

关键词关键词:运动想象;脑电信号;相位同步;AR模型;频带能量特征;支持向量机

DOIDOI:10.11907/rjdk.172526

中图分类号:TP301

文献标识码:A文章编号文章编号:16727800(2018)003000704

英文摘要Abstract:The feature extraction of motor imagery has been plagued by the brain computer interface researchers. In this paper, a feature extraction method based on phase synchronization and AR model coefficients is proposed. Which calculate the phase synchronization feature of acquised EEG by Hilbert transform, then using Burg algorithm to calculate the AR model coefficient is 6, finally the combined 14 dimensional feature vector of two kinds of feature classified by support vector machine. The classification results show that during 3s~7s of the trail, the average correct classification rate was 82.58% of phase synchronization combined with AR model parameter extraction, the highest classification accuracy rate is 88.96%, which is superior to the traditional extraction methods,like common spatial pattern and wavelet transform, the experimental results also showed that the optimum extraction time range of the phase synchronization feature extraction is 3s~7s of the Trail,this method provides an effective way to study the feature classification and recognition of motor imagery EEG for BCI.

英文关键词Key Words:motor imagery; EEG; phase synchronization; AR mode; SVM

0引言

脑-机接口(Braincomputer Interface,BCI)在大脑与计算机之间建立了一个新的通信渠道,用户可以直接通过大脑思维与外部进行交流或控制外部设备。脑-机接口(BCI)是当前国际重大前沿研究和应用热点。在各类BCI中,运动想象是应用范围最广、实用性最强的BCI范式,通常报道的“意念控制”或“思维控制”主要指该类BCI[1]。

在脑机接口技术中,好的特征提取方法会提高脑电信号的分类正确率,由此可以看出单通道的特征提取对脑电信号处理的重要性[2]。目前,BCI中常用的特征主要有AR模型和AAR模型系数、小波系数、频带能量、功率谱以及各种特征之间的组合。随着脑机接口技术的发展, 涌现出了很多运动想象脑电特征提取方法,最常用的有共同空间模式(Common spatial pattern,CSP)、功率谱、自适应自回归(Adaptive auto regressive,AAR) 模型、自回归(Auto regressive,AR)模型[35]、小波变换(Wavelet transform,WT)以及小波包变换(Wavelet package transform,WPT)等方法。提取被试事件相关同步/去同步现象的能量,作为脑-机接口的重要特征,得到了较高的分类正确率,但同样作为信号特征的相位特征,不光包含能量特征,还包含一些被人们忽略的信息。目前,把相位考虑作为特征应用到脑机接口的研究不是很多,本文介绍了一种相位同步结合能量的频域特征提取方法。

1实验过程及数据采集

1.1实验过程

实验数据采用2003年奥地利Graz科技大学举办的竞赛数据,采用在线反馈的BCI系统,要求被试通过自主想象左、右手动作实时控制显示界面中光标的移动[6],实验设计的时序如图1所示。

参与实验数据采集的被试是一个没有EEG和BCI实验经验、身体没有患病史的25岁女生。實验安排在一个安静的环境下,试验一共280次,分7个组,每个组进行40次。每个Trial进行9s,前0~2s时间内,被试处于放松状态,系统无任何提示;2s~3s内显示器出现一个“十”字符号光标,同时一个短促的提示音给被试,提示准备开始实验;第3s时显示器上开始呈现“→”或“←”符号光标,此时被试根据显示器上的光标进行相应的想象运动,想象状态到第9s时结束。在线系统对左手、右手两种运动实时在线控制,通过AR模型求得AR模型系数,把AR模型系数和相位同步组合的特征进行分类,获得分类结果作为反馈信息,传递给被试,以便被试更好地调整状态。

1.2数据采集

实验中被试的脑电信号通过双导联方式采集,采集装置选取AgCl电极,差分电极的分布遵循10-20导联的国际标准,实验共采集了3个通道的脑电信号,3个电极(C3,C4,Cz)的分布如图2所示,接地电极为Fpz,记录参考电极为左侧乳突A1。实验过程采用训练集(train_data)和测试集(text_data),两个样本集分别采集左手运动70次和右手运动70次数据,样本数据集的大小统一设定为1 152*140*3。

2特征提取及模式分类

2.1数据预处理

当大脑皮层受到外部实际/想象左、右手运动刺激时,相应的一侧脑区被激活,该区域 Mμ节律(8~13Hz)和βeta节律(14~30Hz)相对减少,另一侧脑区Mμ节律和βeta节律增强为事件相关同步(ERS)[7]。预处理过程中,用通带衰减为0.5dB,阻带衰减为50dB,阻带截止频率为7Hz和32Hz的椭圆滤波器,对采集的脑电信号进行8~30Hz的带通滤波,然后用独立成分分析方法(independent component analysis,ICA)剔除伪迹。

2.2特征提取

2.2.1相位同步特征

为更准确地分析脑电信号,需要分别求出脑电信号的相位成分和振幅成分,本文利用相位同步特征把一些平时不引人注意的特征信息提取出来。相位的同步性一般通过锁相位表示特定时间范围内两类信号的同步程度[8]。首先对C3、C4两个通道的脑电数据进行预处理,剔除眼电、肌电、工频、外部环境等带来的伪迹。再选取有用的频段,通过Hilbert变换求瞬时相位值。运动想象脑电信号的相位同步是运动皮层不同脑功能区域间相互协作、整合的表现。信号间这种相位同步的相关性和幅值的相关性是相互独立的[8]。研究者通常用锁相值(Phase Locking Value,PLV)度量两个信号间的相位同步化程度,定义如下:

PLV=1N∑Nt=1exp(jθ(t))(1)

式(1)中,θ(t)为t时刻两个信号间的相位差,θ(t)=θi(t)-θj(t),N为该时间段内的数据总量。PLV是一个平均值,大小介于0~1之间,PLV的值越大表示两个信号越稳定,且相位同步特征越明显。反之,当两个信号不稳定、相位不同步时,PLV的值越小[911]。

通常用小波变换或Hilbert变换计算信号的瞬时相位值,研究表明这两种方法具有一致的效果[12]。本文选用后者计算变换过程:

y(t)=1tP∫+∞-∞x(τ)t-τdτ(2)

式(2)中,y(t)为实信号x(t)经Hilbert变换的生成信号,P为柯西主值。瞬时相位θ(t)由下式计算:

θ(t)=arctany(t)x(t)(3)

根据运动想象过程中不同区域脑电信号的同步化特征,本文选取C3Cz和C4Cz两个通道的PLV值作为相位同步特征。通过实验时序可知,运动想象从第3s开始,对应的大脑不同区域的相位同步情况在时域上是有差异的,本文通过训练数据寻找提取相位同步特征的最佳时间段。图3和图4中,实线代表左手想象的PLV值在时域的分布,虚线代表右手想象的PLV值在时域的分布。通过图3可知,两种想象任务的相位同步情况在3s~7s内较为明显。每一条曲线都是由对应某一类想象任务70个单次实验在每一个采样点的PLV均值构成。同理,图4为C4Cz通道对两种想象任务中PLV时域的分布图。

2.2.2AR模型系数特征提取

AR模型也称为自回归模型,是脑机接口中一种常用的特征提取方法。考虑到参数的求解难易度,一般都采用自相关法求解,因为这种方法在处理数据时应用简单。研究者通常认为非平稳信号x(n)是由一个离散时间系统H(z)在一个方差为σ2r白噪声信号r(n)的激励下得到的,这个激励过程可用差分方程简化:

x(n)=-∑pi=1aix(n-i)+r(n)(4)

式(4)中,p代表AR模型的阶数,{ai}表示p阶AR模型的参数,其系统转移函数为:

H(z)=x(z)R(z)=11+∑pi=1aiz-k(5)

假设信号x(n)是短期随机平稳的,则其功率谱为:

Px(ω)=σ2rH(ejω)2=σ2r1+∑piaie-jiω2(6)

通过AR模型进行功率谱估计,目的是得到{ai}和σ2r。在式(1)两端分别乘以x(n-m)可以求得脑电信号AR模型参数和自相关函数的关系:

Rxx(m)=-∑pi=1aiRxx(m-i)m>0

-∑pi=1aiRxx(m-i)+σ2rm=0

Rxx(-m)m<0(7)

在已知自相關函数的情况下就可以求解出{ai}以及σ2r,进一步得到信号功率谱的估值。构建AR参数模型时,选择模型阶数是关键。阶数过高,谱估计会出现谱分裂,太低则会导致分辨率较低。根据LD算法、Burg算法的数学递推公式得到AR模型系数。实验研究表明6~8阶的AR模型处理脑电效果比较好。本文选取6阶AR模型处理3s~7s数据,分别对每个脑电采集通道提取6个AR模型系数。

综上,每次实验提取C3、C4两个通道在第3s~7s时间内的12个AR模型系数和C3Cz、C4Cz的相位同步特征向量,组合成一个14维的特征向量。

3模式分类

支持向量机(Support vector machine,SVM)是一种用于分类和回归分析的监督学习方法,它的本质是寻找能使未知样本分类误差最小的最优超平面,在实现最小化分类误差的同时使分离的两类数据点之间的距离最大化。脑电信号是一种线性不可分的非线性非平稳信号,而SVM分类器可以将低维线性不可分的数据映射到高维线性可分的特征空间,并且能很好地解决单次左、右手运动想象实验脑电的小样本分类问题。常用的支持向量机寻优方法可从固定参数、直接寻优、网格寻优、遗传算法(genetic algorithm,GA)寻优、粒子群(particle swarm optimization,PSO)寻优等方面进行研究。

支持向量机基本原理如下:

假设两个变量的训练样本集表示为{(x1,y1),(x2,y2),(x3,y3)……(xn,yn)},xi属于Rd,yi的区间在{-1,1}之间,i=1,2,3…n。当训练样本处于线性可分时,就会把正负样本集分开,形成两个超平面,超平面公式如下:

(xi·w)+b≥1,yi=1(xi·w)+b≤1,yi=-1(8)

采用的样本集分为两种情况,一种正负样本集可以分类,另一种正负样本集不能分类,针对不同情况分类的条件不一样。

正负样本集分类的约束条件由下式表示:

yi(w·x+b)-1≥0i=1,2,3,∧,N(9)

正负样本集不能分类时,需要考虑采用松弛变量(ξi)和惩罚因子来处理[5,11],那么分类优化问题转化为:

min12‖w*‖2+c∑Ni=1xi,i=1,2,∧,N(10)

yi((xi·w*)+b*)≥1-ξi,i=1,2,∧,N(11)

C为惩罚因子,ζi为松弛变量(ζi>0)。k(xi,xj)=(Φ(xi),Φ(xj))为映射函数,把低维不可分的样本点从原空间映射到高维空间。这里内积函数选用径向基(RBF)核函数,它满足Mercer条件。

k(xi,xj)=exp(-g‖xi-xj‖2),g>0(12)

当样本集被一个超平面区分开时,需要考虑正负样本数据与超平面的距离。

如果两者距离最大,则把这个超平面命名为最优超平面,具体表示为如下公式:

w·x+b=0(13)

如果两者之间距离最小,同时距离为w·xi+b‖w‖=1‖w‖时,可通过二次规划解决这个问题:

minψ(w,b,ξ)=12(w·w)+C∑Ni=1ξi(14)

公式中的C表示为错误的惩罚因子,它关系到支持向量机的收敛速度和能力。

最后确定通过采用拉格朗日乘子算法求样本的类型,其决策分类函数表示如下:

f(x)=sign∑li=1aiyiK(xi,x)+b(15)

K(xi,x)=φ(xi)·φ(x)(16)

ai表示拉格朗日乘子,b表示分类阈值,K(xi,x)表示内核函数。

SVM常被用于验证特征提取算法好坏,其核函数决定了SVM分类算法性能。文中选取径向基核函数用于支持向量机的核函数,利用前文提取的AR模型系数结合相位同步特征向量对测试集脑电信号进行分类。

4实验结果与分析

实验采集了被试运动想象下C3、C4和Cz通道的脑电数据,在AR模型参数特征方面只选取了C3、C4两个通道的脑电信号;在相位同步特征方面,选取C3Cz和C4Cz两个通道脑电信号的相位同步特征。通过观察图2可知,想象左右手运动的相位同步特征差距在3s~7s最为明显。本文通过小波变换(WT)、共同空间模式(CSP)和相位同步特征与AR模型系数相结合的方法,提取1s~5s、3s~7s和5s~9s的脑电特征,经SVM分类器分类后得到的分类正确率分别为86.41%、82.43%、88.96%,实验结果证明了相位同步特征与AR模型参数相结合,相对于传统方法提取脑电特征具优越性,同时也验证了相位同步特征提取的最佳时间段为3s~7s。表1呈现了小波变换(WT)、共同空间模式(CSP)、相位同步特征提取3种方法下,运用SVM分类器对Trail的1s~5s、3s~7s、5s~9s时间段内特征分类的平均正确率和最高正确率。

与以往方法相比,利用AR模型系数和相位同步特征相结合的特征提取方法相对简单而且效果好。从上述不同分类器的分类精度对比和分析结果可以看出,采用特定时间段的相位同步特征可得到可靠度更高的分类结果。

5结语

本文对运动想象脑电信号AR模型系数和相位同步特征相结合的方法实现脑电信号识别进行了研究。在Hilbert变换方法处理脑电信号后,应用锁相值(PLV)提取脑电信号的相位同步特征,采用SVM分类器对测试集脑电信号进行特征识别,研究了AR模型系数和相位同步特征结合对信号分类识别率的影响。实验表明,在3s~7s时间段提取的相位同步特征与AR模型系数结合后分类识别率为88.96%,提高了在线系统性能,达到了BCI竞赛水平。该方法不足之处在于处理脑电信号时间稍长,应用于在线系统还需要优化算法。而脑电处理时间稍长的原因可能在于需要提取两方面的特征并进行结合。下一步工作将研究如何优化该方法,缩短脑电处理时间,以及将该方法应用到在线系统中。

参考文献参考文献:

[1]高上凯.浅谈BCI的发展现状与挑战[J].中国生物医学工程学报,2007,26(6):801803,809.

[2]刘冲,王宏.基于多类运动想象任务的脑电信号分类研究[J].生物医学工程学杂志,2012,29(6):10281030.

[3]陈海英.AR模型功率谱估计常用算法的性能比较[J].漳州师范学院学报:自然科学版,2009(2):127129.

[4]庄伟,段锁林.基于SVM的4类运动想象的脑电信号分类方法[J].常州大学学报:自然科学版,2014,26(1):4345.

[5]LEMM S, SCHAFER C,CURIO G. BCI competition 2003 dataset III: probabilistic modeling of sensorimotor μ rhyths for classification of imaginary hand movements[J]. IEEE transactions on Biomedical Engineering,2004,51(6):10771080.

[6]E THOMAS,J FRUITET,M CLERC.Combining ERD and ERS features to create a systempaced BCI[J].Journal of Neurouscience Methods,2013,216(2):96103.

[7]王娜.腦电信号相位同步特性研究[D].长沙:湖南大学,2011.

[8]ALVAREZMEZA A M, VELASQUEZMARTINEZ L F, CASTELLANOS DOMINGUEZ G. Timeseries discrimination using feature relevance an alysis in motor imagery classification[J]. Neurocomputing,2015,151(1):122129.

[9]WANG YONG XUAN,QIU TIANSHUANG,LIU RONG,et al.Dynamic motor imagery classification with signal power projection based feature[J].Signal Processing,2012(28):10591062.

[10]危傲.基于SVM算法的分类器设计[J].电子科技,2015(6):6871.

[11]胡剑锋,包学才,穆振东,等.基于相位同步的脑电信号分类算法研究[J].微电子学与计算机,2008,25(9):138143.

[12]MCFARLAND D J,MCCANE L M,DAVID S V,et al.Spatial filter selection for EEGbased communication[J].Electroenceph.Clin.Neurophysiol,1997,103:386394.

责任编辑(责任编辑:杜能钢)

猜你喜欢
支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
基于改进支持向量机的船舶纵摇预报模型
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究