酒精脑电信号降维去噪方法的研究

2020-01-07 10:43赵蕾白雪梅胡超
关键词:脑电降维电信号

赵蕾,白雪梅,胡超

(长春理工大学 电子信息工程学院,长春 130022)

酒精是亲脂性物质,长期饮用可引起多种神经损伤和精神障碍,包括依赖、戒断综合征及精神性疾病症状。与短时大量饮酒造成的急性酒精中毒症状不同,长期酗酒引发的神经损伤造成的酒精使用障碍不易被察觉,极易给从事高风险工作的人群带来安全隐患。因此如何更准确、更快速的检测出长期酗酒所造成的神经损伤的研究是很有必要的。

脑电图(Electroencephalogram,EEG)信号可以作为长期酗酒造成的脑神经损伤的诊断依据。诊断从患者观察和数据收集开始,去除脑电噪声,提取有效特征作为输入信号送到各分类算法模型中,达到智能辅助诊断的目的[1-2]。而脑电图的非线性、非平稳性、非周期性的特征使得脑电信号的去噪与特征提取面临很多困难。由于脑电信号是包含大量脑电信息的多电极数据,且极易受到各种噪声的影响,信号能量分布分散,而酒精脑电相对于正常脑电变化更复杂,如何在预留信号原始信息的基础上尽量减少数据分析的计算量,在去除庞大的脑电图数据中的噪声的同时又能保留有效数据和主要特征是研究的目的。

1 实验数据来源

EEG数据来源于纽约州立大学健康中心Henri Begleiter神经动力学实验室。数据集包含了放置在受试者头皮上的64个电极的测量数据,这些电极在头皮处的采样频率为256 Hz,采样时间为1 s。

受试者被分为两组,有长期酗酒史的酒精组和无饮酒史的对照组。受试者受到90张来自Snodgrass和Vanderwart图片集合的物体图片的刺激,在实验过程中两张图片刺激交替出现,每张图片刺激持续时间为300 ms,受试者需要判定两个刺激是否相同,以此获得被测试者的事件相关电位(ERP)[3]。每个受试者都进行了120次试验。原始64通道酒精脑电数据示例如图1所示。

图1 64通道原始酒精脑电数据

2 脑电降维

在脑电信号的研究应用中,为了描述大脑不同区域对刺激的反映,需要对大脑不同区域多个通道进行数据采集[4]。多通道的脑电数据样本给研究和识别应用提供了大量的信息,但是也给后续的数据处理和识别工作增加了工作量。而在酗酒人群和正常对照组的脑电分析研究中,不同通道的脑电信号之间可能存在相关性,如果分别对每个通道单独分析,得到的结果是孤立的,盲目的减少指标又会丢失有用信息,可能得到错误的结论。因此,需要找到一种在减少分析数据的指标同时最多的保留原始数据信息的方法,以达到对数据进行降维[5]的同时也能对数据进行全面分析的目的。

主成分分析法(PCA)就是这样一种把多个特征映射成少数几个综合特征的统计分析降维方法,它是模式识别中数据缩减、图像压缩和特征提取的重要技术。

2.1 主成分分析法(PCA)原理

PCA的主要思想是将n维特征映射到k维上,这个k维是全新的正交特征也叫做主成分,就是以原有n维特征为基础提取出来的k维特征。PCA的原理就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取的是与第一个坐标轴正交的平面中方差最大的方向,第三个轴是与第一、二个轴正交的平面中方差最大的方向以此类推,得到了n个这样的坐标轴。大部分方差都是包含在前面的k个坐标轴中,后面的坐标轴方差几乎为0,因此,后面的坐标轴可以被忽略只保留前面k个坐标轴。通过计算数据矩阵的协方差矩阵,得到协方差矩阵的特征值与特征向量,选择特征值最大(即方差最大)的k个特征对应的特征向量组成的矩阵,从而实现数据降维的目的。

PCA算法的主要步骤如下:

(1)样本集为m维随机向量组成的样本集D={x1,x2,...,xm},其中n个样本构造样本矩阵,Di={xi1,xi2,...,xim}T,i=1,2,...,n对样本阵进行标准变化:

得到标准化矩阵A。

(2)计算样本的协方差矩阵AAT;

(3)对协方差矩阵AAT矩阵做特征值分解,得到协方差矩阵的特征值λ1,λ2,...,λn(i=1,2,...,n)。

(4)特征值所对应的特征向量为b1,b2,...,bn;得到投影矩阵B=(b1,b2,...,bn)T。

(5)令Y=(y1,y2,...,yn)T,Y=BTA,且有BTAATB=Λ,其中,y1,y2,...,yn彼此不相关,称y1,y2,...,yn分别为第1、第2、...、第i个主分量,的值称为主分量的贡献率。前k个主分量的累积贡献率定义为:

选取前k个主分量代替原始数据做分析,这样就可以达到降低原始数据维数的目的。

2.2 酒精脑电降维

本研究中的分析变量是64个电极通道,将采集到的脑电信号经过简单滤波后处理成如下矩阵:

首先采用PCA算法对64通道脑电数据进行降维处理。可得到主成分贡献率如图2所示。

图2 各主成分贡献率

主成分累积贡献率如表1所示。

表1 前k个主成分累积贡献率(%)

一般累计贡献率达到80%~90%之间[6],则说明这些主成分保留了原始数据的主要信息,因此,保留前十五个主成分进行分析,将数据维数从64维降到了15维,实现了数据压缩降维。降维后前15个主成分系数如图3所示。

图3 前十五个主成分系数

对比图1和图3,经过降维后的数据与原始数据特征一致,数据主要特征被很好的保留下来,而数据维数减少,后续的数据处理工作量也随之减小。

3 脑电去噪

经过PCA降维,酒精脑电数据中的部分冗余特征被去除,但是脑电信号是一种非线性、非周期性的非平稳信号,极易受到噪声干扰,因此经过降维提取的主成分包含噪声信号。脑电信号中包含的主要噪声就是脑电信号伪迹,脑电信号伪迹去除的最大困难在于人体自身伪迹信号的去除(如眼电伪迹等)[7]。自身伪迹与环境噪声不同,它易与脑电信号重叠,无法通过常规的滤波手段去除,现在常用的脑电信号去噪方法普遍需要同时采集伪迹信号数据作为参考进行去噪的工作,而许多脑电实验无法使用眼电电极等检测手段进行信号检测作为参考。如何在没有参考数据的情况下去除噪声并尽可能多的保留原始脑电数据的特征是脑电信号研究要解决的一个问题。

目前有许多信号领域内经常应用的去噪方法例如快速独立成分分析法(FastICA)等方法被应用于脑电去噪的领域,但是由于脑电信号的特殊性,这些去噪方法并不完美。

取降维后得到的第一个主成分如图4所示。

图4 第一主成分

因所用脑电数据无先验参考信号,所以考虑使用FastICA对脑电数据进行去噪处理。以第一主成分为例,应用FastICA对酒精脑电进行去噪,得到去噪前后效果对比如图5所示。

图5 FastICA去噪前后效果对比

从图5所示的结果可以看出,针对本文采用的实验数据,由于采样点数较少,FastICA虽然去除了脑电中的伪迹噪声,但是原有数据特征也损失严重,去噪后的脑电信号只保留了较少的数据信息。且这种方法对初始值的选择比较敏感,计算量大,分选时间长,对信噪比较低的信号估计精度也偏低。

奇异值分解(SVD)[8]是一种用于信号去噪的非线性滤波方法。这种去噪技术是空间算法的一种,经过SVD可以将带有噪声信号的向量空间分解纯净信号主导的子空间和噪声信号主导的子空间,通过去除噪声空间中的带噪声信号分量来估计纯净信号,适用于无先验参考的脑电信号的去噪。

3.1 奇异值分解法(SVD)原理

有一采集到的含噪声原始信号X={x(i)},i=1,2,3,...,N,其中N是信号的长度,首先构造Hankel矩阵,形式如下:

式中,m=N-n+1,1<n<N,n的取值范围一般为N/20~N/2。实际应用中一般令m≥n,存在A∈Rm×n。对A做奇异值分解,即一定存在正交矩阵U∈Rm×m和正交矩阵V∈Rn×n,使得

式中,Σ∈Rm×n为对角矩阵,Σ=diag(σ1,σ2,...,σp),p=min(m,n)。对角线元素σ1,σ2,...,σp称为A的奇异值并按降序排列,其中包含了A的秩的特性信息。分别将U和V的列向量组成正交基空间,那么A可以认为是由多个分量的线性叠加得到的,每一个分量用Di代表,且每一个分量都可以用对应的奇异值表示出来,描述如下:

式中,ui=Rm×1,vi∈Rn×1,i=1,2,...,p。每个奇异值对应着一个不同的信号分量,并且奇异值满足σ1≥σ2≥...≥σr≥σr+1≥...≥σp≥0,前面r个奇异值代表了有用的信号分量,后面p-r个奇异值则对应着噪声信号分量,r即为需要保留的矩阵的有效秩的阶次,从而得到重构的去噪后的纯净信号。

3.2 酒精脑电去噪

依然以酒精脑电信号经过PCA降维后得到的第一个主成分为例,构造Hankel矩阵。

对Hankel矩阵Yi进行奇异值分解,得到奇异值分布如图6所示。

图6 第一个主成分矩阵的奇异值

想要得到的重构信号既尽可能地保留原始数据的特征,又要去除噪声干扰,就要合理地保留奇异值。因此,如何确定有效秩的阶次是SVD的关键。选取不同有效秩阶次对信号去噪的效果是存在着明显的差异的,阶次选择过大会导致信号去噪不彻底,去噪后的信号中仍然存在噪声;阶次选择过小,会导致信号信息缺失,信号特征提取不全。

对于这个问题,参考文献[9]提出一种方法,利用SVD本身的奇异性检测能力达到SVD信号去噪中有效阶次确定的目的,然而经过实验得到分量信号D2如图7所示。

图7 奇异值序列分量信号D2

实验所得脑电信号数据没有明显的频率特征和周期特点,很难准确的判断信号分量中奇异点的位置,这种方法对于采样信号频率小、采样点数少的脑电信号数据集并不适用。

在参考文献[10]中研究了信号与噪声的奇异值特征,文中指出正常信号的奇异值有突变而噪声信号的奇异值相对平稳。文献中提出了奇异值差分谱的概念,它由奇异值序列的前向差分组成,可以分辨出复杂信号奇异值的突变状态,奇异值的有效秩的阶次选择可以通过差分谱的峰值来实现。

图8 奇异值差分谱

通过图8可以看出奇异值差分谱的最大峰值位于第二个坐标,所以有效秩的阶次选择为2,按照差分谱选择奇异值的原则,保留前两个奇异值重构后的信号如图9所示。

图9 奇异值差分谱法重构信号

通过图像可以看出,奇异值差分谱法克服了有限采样点数和噪声带来的问题,在去除噪声的同时比FastICA法保留了更多原始数据的特征,但是数据幅值压缩过大,波形细节丢失的问题仍然很严重。

视觉刺激产生事件相关电位(ERP)的能量分布比较集中,过大的奇异值数列将导致信号分量的能量分散,使原始信号数据特征细节丢失。因此,重新构造Hankel矩阵,为了使奇异值分解后得到的奇异值序列尽可能的小,令行数为255,列数为2,得到Hankel矩阵如下:

对Hankel矩阵进行奇异值分解,选择第一个奇异值为有效奇异值,令其它奇异值为零,得到重构奇异值矩阵,然后重构信号序列获得重构信号图10。

图10 重构第一个主成分序列

图10与未经处理的主成分图4相比,部分噪声被去除。与FastICA和奇异值差谱法去噪相比波形的更多细节得以保留。这样去噪的弊端是重构后的波形仍然含有噪声。继续对重构后的信号序列进行奇异值去噪处理。将第一次重构后的序列作为第二次SVD的输入,如此反复,进行奇异值分解的迭代过程直到得到纯净信号,具体流程如图11所示。

图11 SVD迭代流程示意图

如图12所示,经过四次SVD处理去噪后的主成分相比于经过一次SVD处理波形平滑了很多,很明显更多的噪声被去除了,而第一主成分的特征信息也被很好的保留下来。数据处理后的图像表明,对于本实验的脑电数据,经过四次SVD处理去噪后已经得到比较理想的效果,继续重复SVD处理重构信号序列,图像波形基本无变化。

图12 多次SVD后重构第一个主成分序列

同样,对其它14个主成分也进行多次重复SVD处理重构主成分信号序列。

4 结论

传统的非线性信号处理方法对采样时长短、采样点数少的酒精脑电信号数据进行去噪时,不能保留原始数据结构特点,信息损失较多。针对本文采用的脑电信号的数据特点,充分利用了PCA方法可以提取主成分的特点和奇异值良好的数学特性,将PCA与SVD多次迭代方法相结合,对实验数据进行降维去噪处理,成功将64通道的脑电信号降至15维,经过改进的SVD多次迭代处理,对于非线性、非周期性的酒精脑电信号去噪效果明显,计算量减少,且原有的信号特征也被更好的保留了下来。

猜你喜欢
脑电降维电信号
混动成为降维打击的实力 东风风神皓极
基于联合聚类分析的单通道腹部心电信号的胎心率提取
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
基于脑电的意识障碍重复经颅磁刺激调控评估
基于Code Composer Studio3.3完成对心电信号的去噪
基于随机森林的航天器电信号多分类识别方法
基于脑电情绪识别的研究现状
Bagging RCSP脑电特征提取算法
脑电逆问题在运动康复领域中的应用