“模拟阅读”脑-机接口信号的核Fisher分类

2013-12-22 08:09官金安荆汉娜
关键词:靶标正确率分类器

官金安,荆汉娜,李 梅

(中南民族大学 生物医学工程学院,认知科学国家民委重点实验室,武汉 430074)

脑-机接口(BCI)是指在人脑和计算机或其它电子设备之间建立直接交流和控制通道的人-机通信与控制系统[1].人们可以采用该技术直接通过大脑来表达想法或操纵外界设备,而不需要语言或肢体动作.它涉及神经科学、信号检测、信号处理、模式识别等多个学科.该技术的核心是通过高精度的计算机算法,将采集到的脑电信号转换成特定的控制命令,实现对外界设备的控制.因此如何对提取到的信号特征进行分类,转换成可以被计算机识别的命令或操作信号成为脑-机接口系统的关键问题.

设计分类器的关键是寻找一组判别函数,贝叶斯决策理论、人工神经网络、支持向量机等都是脑电信号分类中常用的方法,然而在“模拟阅读”脑-机接口模式下,核Fisher方法还没有具体应用.实际问题中,为了避免样本数量过大的问题,人们往往利用样本集直接设计分类器.具体做法:首先给定某个判别函数类,然后利用样本集确定出判别函数中的未知参数,其中最简单的函数形式是线性函数.由于脑电信号大部分是线性可分的,可以利用线性函数设计分类器,如感知准则分类器[2],Fisher分类器[3,4]等,但并不是所有的脑电信号都线性可分,实验表明,约有10%左右的信号是线性不可分但非线性可分的,单独使用线性分类器不能达到最佳效果,本文引入核Fisher分类器[5-7]对脑-机接口信号进行分类,并与传统的线性分类器进行了比较.

1 分类算法

已知来自ω1和ω2两类样本集{x1,x2,…,xN},两类样本的线性判决函数如下式:

g(x)=wTx,

其中,w为权向量,如果w不同,映射结果的可分离程度也不同.寻找最佳的投影方向,就是寻找最佳w的过程.

1.1 感知准则分类器

感知准则函数通过迭代优化确定最佳分界面,最佳界面取决于所使用的最佳准则,其基本思想是寻找一个权向量,使规范化增广样本向量集的错分样本数最少,利用错分类信息对当前的界面进行修正.

样本集通过变换,得到一组规范化增广样本向量{z1,z2,…,zN}.变换后,不需考虑样本原来的类别标志,只要找到一个对全部样本zi都满足wTzi(i=1,2,…,N)的权向量即可.

构造一个准则函数[2],如下式:

其中,zk是被权向量w错分的样本集合,当z∈zk时,有-wTz≥0,显然Jp(w)≥0.当且仅当错分样本集zk为空时,Jp(w)=0,即Jp(w*)=minJp(w)=0,这时将不存在错分样本,而w*就是我们要寻找的解向量.采样梯度下降法求解最优解向量使被错分的样本数尽量地少.

1.2 Fisher分类器

Fisher准则基本原理:找到一个最合适的投影轴,使两类样本在该轴上投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使分类效果为最佳.

Fisher准则函数[3],如下式:

从总体上来讲,JF(w)的值越大越好,在这种可分性评价标准下,使JF(w)达到最大值的即为最佳投影方向.用Lagrange乘数法解得最佳投影方向:

利用w*,将样本x往该方向上投影,可得:

y(w*)Tx,

利用先验知识选定分界阈值点y0,若y>y0,则x∈w1,否则,x∈w2.

1.3 核Fisher准则

核Fisher方法首先通过非线性变换将数据x映射到某个高维线性特征空间F,然后在这个特征空间进行Fisher线性判别,这样就隐含地实现了原输入空间的非线性判别.设Φ是输入空间到高维特征空间F的非线性映射:Φ:x→F.

F空间最大化目标函数[7],如下式:

由于F空间的维数通常很高甚至无穷维,所以引入内积核函数,如下式:

k(xi,xj)=ΦT(xi)Φ(xj),

常用的核函数分别如下:

(1)径向基核函数:k(x,xi)=exp(-λ‖x-xi‖2),λ为参数.

(2)多项式核函数:k(x,xi)=(s+c)d,s,c,d为参数.

(3)线性核函数:k(x,xi)=.

本文采用的径向基核函数k(x,xi)=exp(-λ‖x-xi‖2).由再生核理论可知,F空间中的任何解向量w都可由F空间中的训练样本({Φ(x1),Φ(x2),…,Φ(xN)})线性表示,ai为F空间的权向量,N为训练集样本数,即:

在F空间中,求解Fisher线性判别函数,如下式:

求解最佳投影方向a,特征空间中Φ(x)在w上的投影变换为k(xj,x)在a上的投影,如下式:

设定阈值y0,将待测样品进行投影得到y,如果y>y0则样本x属于ω1,反之x属于ω2.

2 实验方法

2.1 实验描述与数据获取

本实验首先记录在“模拟阅读”脑-机接口模式下靶标刺激和非靶标刺激所引发的脑电信号[8],分别采用上述3种分类方法对两类脑电信号进行模式分类,比较分类正确率.本实验的实验模式:选取4名男性、1名女性视力正常(或矫正视力正常)受试者,依10-20电极安放国际标准正确佩戴电极帽(安装32个Ag/AgCl电极),以舒适坐姿坐在监视器前面约40cm处.监视器屏幕背景颜色为黑色,中央放置一个像素为20×20的小视窗,若干个非靶标刺激符号(图1(b))与一个随机出现的靶标刺激符号(图1(a))组成的符号串(图1(c))匀速从右向左滑过屏幕中央的小视窗,要求受试者从小视窗中搜索靶标刺激符号(图1(a)),从而得到视觉诱发事件相关脑电位.

图1 本实验所用的诱发符号串的举例

图1 (a),(b),(c)中符号具有完全相同的结构,像素为20 ×20,(a)为靶标符号,中间的竖线被染成红色;(b)为非靶标符号,中间的竖线没有被染成红色;(c)为由若干个非靶标和一个随机出现的靶标符号构成的诱发符号串.

每次记录人工音提示开始,受试者集中注意力于小视窗中平滑移动的诱发符号串,搜寻靶标符号.靶标符号将在人工提示音出现后第2个1s内的某个时刻随机出现(将1s分成10个刻度),每次实验记录的时程为2s(靶刺激出现前后各1s),采样频率为2kHz,采集4096个样本.采样数据记录为一个Matlab数据文件,格式为:通道号×样本×重复作业次数(5名受试者的数据大小依次为32×4096×(104、102、105、110、116)).实验中,我们使用的脑电信号采集设备为Biosemi公司的ACTIVE2 32道生理信号采集仪[9].

2.2 数据预处理与特征选择

由于脑电信号具有非平稳性的特点,并且极易受到各种噪声干扰,特别是工频干扰.采集到脑电信号后,有必要进行预处理,减少噪声对有用信号的干扰,提高信噪比[10,11].本次实验对数据进行几个步骤的预处理操作:去除均值,20Hz的低通滤波,下8采样,幅值归一化.将那些不需要的信号尽可能地去除,便于后面的特征提取和分类处理.

特征选择的任务是从一组数量为N的特征中选择出数量为n(n

(a)1000ms的非靶刺激的信号; (b)1000ms的靶刺激信号

图2所示在模拟阅读模式下,某受试者在多次重复实验中采集在电极PO3处记录到的EEG信号,从150~375ms,靶与非靶信号差异非常明显,本次试验把每1s中的150~375ms之间预处理后的数据点(53个样本点)作为两类信号分类的特征向量.

2.3 核Fisher分类的步骤

经过预处理和特征提取处理的数据,采用核Fisher准则,按下述步骤进行分类.

(1)采集到的数据随机分为两部分a、b,数据a大约占总数据的60%,用于训练模型.数据b占总数据的40%,用于测试.

(2)参数选优,步骤如下.

(ⅰ)把数据a随机平均分成两部分c、d,数据c用于训练模型,数据d用于测试该模型分类的正确率.

(ⅱ)对数据c采用核Fisher准则方法训练模型,本实验选用的核函数为高斯径向基核函数,其中高斯函数中的σ选取过程中,设置一个参数选优循环,选取数据d测试分类正确率最高的参数.

(ⅲ)重复步骤(2)10次,并求出10次正确率的平均值.

(ⅳ)选取正确率最高的1次,作为高斯函数的最优参数σ.

(3)对数据b测试最优参数分类的正确率.

(4)重复步骤(1)、(2)、(3)10次,得出最终平均正确率.

为了对比3种方法的正确率,对感知准则和Fisher准则也做了交叉验证处理.

3 结果与讨论

按照上述的预处理和提取特征的方法,对采集到的5个受试者s1,s2,s3,s4,s5的数据进行处理,使用上述3种分类方法分类,图3为受试者s1的测试集分类决策图.

图3中,(a)为感知准则函数函数测试得到的决策图;(b)为Fisher函数测试得到的决策图;(c)为核Fisher函数测试得到的决策图,其中*为非靶标,○为靶标.可以看出核Fisher的分类效果比单独使用感知准则和Fisher准则优越.

(a)感知准则测试集决策图

(b)Fisher准则测试集决策图

(c)核Fisher准则测试集决策图

用上述分类方法对预处理的数据进行10次交叉验证,分别得出5名受试者3种方法的10组数据平均正确率,图4为受试者s1采用3种分类方法的10组平均正确率.

图4 受试者s1 3种分类方法的10组平均正确率

对交叉验证得到的10组正确率分别求取平均值,得到结果,如表1所示.

表1 5名受试者3种分类方法的平均正确率

如图3、图4及表1所示,通过比较,可以看出核Fisher准则分类正确率最高,分别高出单独使用Fisher和感知准则约为20%和10%,感知准则分类正确率高于单独使用Fisher准则的正确率,约为10%.Fisher准则将线性方程中的法向量与样本的乘积看作样本向量在单位法向量上的投影,可以做到不同类的样本在法向量上的投影呈现类内聚集,类间分散的效果.感知准则函数,利用错分类信息对当前界面不断进行迭代修正,所以正确率相对Fisher分类器较高.核Fisher判别分析采用非线性映射将原始数据由数据空间映射到高维特征空间,进而在高维特征空间进行Fisher操作.由于采用了非线性映射,而且这种非线性映射往往是十分复杂的,从而大大的增强了非线性数据的处理能力.由于脑电信号一部分线性不可分,所以核Fisher分类正确率相对单独使用感知准则和Fisher准则分类的正确率较高.此外,从图4中可知5名受试者分类正确率不尽相同,主要是由受试者实验过程中注意力集中程度或心理因素不同所造成的.

4 结论

由于脑电信号大部分线性可分,因此感知准则及Fisher准则线性分类方法可以得到较好的结果.但由于约10%左右的脑电信号线性不可分但非线性可分,采用核Fisher分类方法首先将信号非线性投影到线性高维特征空间,在高维特征空间再进行Fisher分类判别.相对于原始Fisher分类和感知准则分类来说,可有效的增加脑电信号的可分性,提高正确率,增强数据的可用性.核Fisher准则基本能满足“模拟阅读”脑-机接口信号分类的需求.

[1]Wolpaw J R,Birbaumer N,Heetderks W J,et al.Brain-computer interface technology: a review of the first international meeting[J].IEEE Trans on Rehabilitation Engineering,2000,8(2):164-173.

[2]廖彩萍,李远清,赵 慧.基于运动想象的脑电信号的分类研究[J].自动化与仪表,2008,4: 1-4.

[3]Fisher R A.The use of multiple measurements in taxonomic problems[J].Annals of Eugenics,1936,7: 179-188.

[4]Mou Huaying.Classification of EEG based on PCA and Fisher discriminant criteria[J].Science Technology and Engineering,2009,22(9): 6853-6855.

[5]Gao Xiangping,Xu Dan,Wu Xiaopei.A new mental task recongnition method based on kernel Fisher discriminant analysis [J].Computer Technology and Development,2006,16(9): 82-84.

[6]Mika S,Ratsch G,Weston J,et al.Fisher discriminant analysis with kernels[C]// IEEE.Neural Networks for Signal Processing IX,Madison,WI: IEEE ,1999: 41-48.

[7]Zhou Xin,Wu Ying.Application of kernel Fisher discriminant analysis to digital signal classification[J].Journal of Beijing University of Posts and Telecommunications,2011,34(01): 35-38.

[8]官金安.脑—机接口及其信号的单次提取[D].武汉: 华中科技大学,2005.

[9]Guan Jin′an,Chen Yaguang.Single-trial EEG classification using in-phase average for brain-computer interface[J].Frontiers of Electrical and Electronic Engineering in China,2008,3(2): 194-197.

[10]杨帮华,颜国正,丁国清,等.脑机接口关键技术研究[J].北京生物医学工程,2005,24(4): 308-310.

[11]Shen M,Sun L,Chan F H Y.Method for extracting time-varying rhythms of electroencephalogy via wavelet packet analysis[J].IEEE Proceedings,Science,Measurement and Technology,2001,148(1).

[12]Millán J,Mourio J.Asynchronous BCI and local neural classifiers: an overview of the adaptive brain interface project [J].IEEE Trans Neural Syst Rehab Eng,2003,11(6): 159-161.

[13]Chen Min,Guan Jinan,Liu Haihua.Enabling fast brain-computer interaction by single-trial extraction of visual evoked potentials[J].Journal of Medical Systems,2011,35(5):1323-1331.

猜你喜欢
靶标正确率分类器
纳米载体可缓解农药对靶标作物的负作用
个性化护理干预对提高住院患者留取痰标本正确率的影响
“百灵”一号超音速大机动靶标
基于朴素Bayes组合的简易集成分类器①
门诊分诊服务态度与正确率对护患关系的影响
基于特征选择的SVM选择性集成学习方法
纳米除草剂和靶标生物的相互作用
基于差异性测度的遥感自适应分类器选择
生意
生意