脑电波信号多域变换与深度学习癫痫诊断

2022-11-17 07:50陈浩滨葛薇杨超郑霖
现代信息科技 2022年20期
关键词:格拉姆小波时域

陈浩滨,葛薇,杨超,郑霖

(1.桂林电子科技大学 广西无线宽带通信与信号处理重点实验室,广西 桂林 514004;2.桂林医学院 人文与管理学院,广西 桂林 514004)

0 引 言

癫痫是由于大脑神经元突发性异常放电,导致短暂的大脑功能障碍的一种慢性疾病。我国有超过900 万的癫痫患者,并且癫痫患者数量正以40 万的速度在快速增长[1]。通过脑电信号(Electroencephalogram,EEG)诊断癫痫是一种有效且成熟的方法。但EEG 的判读是完全依赖医生的肉眼和经验判读,容易造成判读错误和误诊。通过智能信号处理算法对癫痫EEG 的自动识别是近年来医学智能信息处理的研究热点。

癫痫EEG 自动识别算法主要包括传统机器学习法和深度学习法。其中,传统机器学习法的主要思路是:设计人工特征,再使用机器学习的分类器对特征进行识别。但是不同人的癫痫EEG,以及同一人不同时期的癫痫EEG 均存在较大差异,人工特征往往不能很好地捕捉EEG 的信息[2]。

深度学习算法大幅提升了智能特征提取的性能,近年来开始广泛应用于医学领域。Rajendra Acharya 直接使用1 维卷积神经网络(Convolutional Neural Networks,CNN)对1维的EEG 时序信号进行识别[3],取得了88%的癫痫EEG 识别准确度。Shankar 等人提出先将EEG 编码为格拉姆角场图[4],再使用2 维CNN 对其进行识别,取得了95.75%的癫痫识别准确度。鉴于EEG 的非平稳性和非线性[5],通过获得EEG的短时傅里叶时频图,采用CNN 中LeNet-5 的CNN 对该时频图进行识别。但时频变换本质上折中了时域分辨率和频域分辨率,也即时频变换的时域分辨率低于时域波形谱,频域分辨率低于频谱。且由于时频图同时具备时间轴和频率轴,使得幅值随时间的变化的特征的直观性不如时域波形,导致[5]的性能不理想。

本文考虑在利用连续小波变换将EEG 变换为小波时频图的基础上,利用格拉姆角场变换将EEG 编码为图像纹理,作为小波时频图的信息补充。然后设计一种由2 个并行的2 维CNN 和1 个全连接神经网络(Deep Neural Networks,DNN)构成的集成深度学习模型,2 个2 维CNN 分别提取格拉姆角场图和小波时频图的特征,并在中间层进行特征融合,最后将融合特征输出至DNN 进行癫痫识别。经过在波恩大学的癫痫脑电数据集测试表明,本文所提方法的准确度和敏感度优于传统的单神经网络模型,为癫痫等疾病的诊断提供可靠的性能。

1 癫痫EEG 特征

EEG 是一种典型的生物电信号,除了具有生物电信号的特点之外,还具有幅值微弱且低信噪比、随机性和非平稳性、非线性以及突出的频域特性等特点。癫痫患者发作期的异常EEG 称为癫痫EEG,癫痫EEG 携带有包括棘波、尖波、尖-慢波、棘-慢波、多棘-慢波、高度失律和发作性节律波等癫痫样放电[6],癫痫样放电是临床诊断癫痫的重要依据。

1.1 小波时频图

小波变换是借鉴了短时傅里叶对时域信号加窗的思想,但是小波变换使用的是在时频相平面上具有可变的时间窗和频率窗的小波基函数,在低频部分具有较高的频率分辨率和较低的时间分辨率,在高须部分具有较高的时间分辨率和较低的频率分辨率。因此,小波变换非常适用于频率变化较快的信号[7,8]。

函数f(t)的连续小波变换表达式如式(1)所示[9]:

式中,ψ(t)表示小波基函数;*表示取共轭;a表示尺度因子,其影响小波基函数ψ(t)的伸缩;b表示平移因子,其影响小波基ψ(t)的平移。

小波基函数的选择,一般考虑通常涉及多个属性之间的比较,例如正交性、平滑性、紧凑支撑以及对称性等[10]。由于Morlet 小波具有显式解析方程、对称性、平滑性好以及支撑长度有限等优点。因此,常采用Morlet 小波作为小波基函数,本文亦选用Morlet 小波作为小波基函数。

对获得的小波时频图进行去白边和裁剪,结果如图1和图2所示,癫痫EEG 的小波时频图与非癫痫EEG 的小波时频图相比,呈现出更多的亮点和暗点、亮点和暗点之间的边界明显以及能量更多地集中在高频部分的特点。由于频率轴的干扰以及连续小波变换本身的特点,小波时频图无法表征出EEG 时域波形的细节,幅值随时间的变化的特征也不直观。

图1 非癫痫EEG 的时域波形和小波时频图

图2 癫痫EEG 的时域波形和小波时频图

1.2 格拉姆角场图

格拉姆角场变换可以将时间序列编码为图像纹理,度量时间序列的各个数据点之间的相关性并且将时序序列的原始序列编码于在图像纹理的主对角线中,保留原始时序序列[11]。

时序序列Xt=X1,X2,X3,…,Xn的格拉姆角场变换主要包括以下步骤:

步骤一:将时序序列Xt信号进行标准化,也即缩放至[-1,1],如式(2)所示:

步骤三:利用各个反余弦值构建格拉姆矩阵,格拉姆矩阵的每个元素数是不同时间间隔内的数据点之间的三角差函数,矩阵的对角元素即为EEG 的原始时序序列。格拉姆角场图GASF 的表示参照式(4):

如图3和4 所示,癫痫EEG 的格拉姆角场图与非癫痫EEG 的格拉姆角场图相比,呈现出更多、更宽且更亮的条纹,且条纹之间的边界感更加明显。其次,格拉姆角场图的对角线亮度变化与时域波形一致,以图像的形式直观的表现了幅值随时间的变化关系。

图3 非癫痫EEG 的时域波形和格拉姆角场图

综上所述,小波时频图能突出癫痫EEG 的时域联合特征,格拉姆角场图可以补偿小波时频图时域分辨率和直观性的缺陷。

2 多域联合特征提取

本文设计的集成深度学习模型如图5所示,该集成深度学习模型由2 个2 维CNN 和1 个DNN 组成。如图5所示,输入层1 和输入层2 分别输入格拉姆角场图和小波时频图,供2 个2 维CNN 对其进行特征提取的特征,将特征融合后输出至DNN 进行癫痫识别。也即本文集成深度学习模型各个单模型之间的集成方法采用的是堆叠法(stacking)。堆叠法时一种常见的集成方法,但是其很容易过拟合。鉴于此,本文在全连接层和输出层之间设置了一个Dropout 层,Dropout 层的丢弃率为0.3,Dropout 层的可以在每次训练过程中,随机屏蔽全连接层中30%的神经元以防止过拟合,提高模型的泛化能力和鲁棒性。为了方便模型训练过程的反向传播,本文的融合层融采用concat 的方式进行特征融合。2 维CNN 还包括归一化层以及池化层,其中,归一化层可以对特征进行规范化,以加速神经网络的收敛,提高网络的泛化能力;池化层可以对特征进行下采样,减少参数量,提高网络的泛化能力。在本文的集成深度学习模型中,除了输出层使用Softmax函数作为激活函数,其他层均采用Relu 函数作为激活函数。

图5 集成深度学习模型

本文的2 维CNN 的具体参数如表1所示,卷积层1-1到卷积层2-2 的卷积核的数量逐渐减少,从而中在2 维CNN 运行过程中特征数量逐渐减小,也即在运行过程中进行特征筛选,缓解集成深度学习带来的计算量激增的问题;卷积层1-1 到卷积层2-2 均采用大尺寸卷积核,以提高二维CNN 网络的感受野,提高特征的综合性和全面性。

表1 2 维CNN 的具体参数

3 算法性能测试

3.1 数据集简介

本次实验采用的数据集为德国波恩大学癫痫脑电数据集[12],该数据集包括“SETA”“SETB”“SETC”“SETD”和“SETE”共五个子集,每个子集包含100 段单通道EEG,每段EEG 的时长为23.6 秒,信号的采样频率是173.6 Hz,也即每段EEG 包含4 096 个采样点。关于五个子集的更多细节如表2所示。

表2 五个癫痫数据集子集的具体情况

3.2 数据集的预处理

深度学习需要大量不同实例的数据集,模型从中学习要查找的特征并生成带有概率向量的输出,从某种意义上说,数据集的大小决定了深度学习的性能,过少的训练数据的问题会导致过拟合。如图6所示,通过滑窗处理将数据集进行扩增,鉴于完全携带癫痫样放电的全部特征的最佳EEG 长度为5~9 秒,因此滑窗长度设置为512。

图6 数据扩增过程

具体地,本文先将数据集按照7:2:1 的比例划分为训练集、验证集和测试集。其中,训练集和测试集分别用于训练模型和在训练完成后评估模型的最终性能,而验证集的设置,是为了监测训练过程中,每一个训练周期(epoch)的训练效果,并根据验证结果不断调整超参数,直至获得理想性能。

然后针对训练集、验证集和测试集的作用进行不同的扩增方案。针对训练集和验证集,设置滑窗的步幅为128,扩充后的EEG 之间的重叠率为75%,1 段EEG 被扩增为29段EEG,确保训练数据和验证数据充足。针对测试集,设置滑窗的步幅为512,扩充后的EEG 之间的重叠率为0%,1 段EEG 被扩增为8EEG,确保测试集的EEG 之间没有重叠提高模型评估的客观性。并从中选择100 段非癫痫EEG和100 段癫痫EEG 构成最终的测试集。最后,利用格拉姆角场变换和连续小波变换分别将训练集、验证集以及测试集进行2 维图像化,并以EEG 的类别(标签)作为图像的文件名进行保存。

3.3 模型测试及训练

首先,将训练集和验证集送入集成深度学习模型,将模型训练300 个训练周期数(epoch),训练过程中的准确率曲线如图7所示。

图7 周期数-准确度曲线

显然,当epoch 达到120 时,训练和验证的准确率曲线均已收敛,且获得较佳准确率。当epoch 达到150 时,训练和验证的准确率曲线出现明显分支,这是因为模型过度训练而出现了过拟合现象。因此,epoch 可以设置为120。训练完成后,将测试集(100 段非癫痫EEG 和100 段癫痫EEG)送入训练好的集成深度学习模型进行识别,以评估模型的最终性能。评估结果如表3所示。

表3 分类结果

最后,引入癫痫EEG 自动识别算法的三个模型指标:敏感度(Sensitivity,SEN)、特异性(Specificity,SPE)、准确率(Accuracy,ACC)[13]对模型的性能进行量化,三个模型指标计算公式如式(5)所示:

记癫痫EEG 为正类,非癫痫EEG 为负类,式(5)中,TP(True Positive)和TN(True Negative)分别表示正类和负类被正确识别的个数,FN(False Negative)代表正类被误识别为负类的个数,FP(False Positive)代表负类被误识别为正类的个数。

根据式(5)给出模型的敏感度、特异性以及分类准确度并同样使用波恩脑电数据集的模型进行比较。如表4所示,从比较结果可以看出本文所提方法的综合性能优于文献[3]和文献[4]。其中,文献[4]给出了多组结果,此处以多组结果的均值作为参考值。

表4 本文方法与传统方法的模型指标对比

4 结 论

本文在分别获取EEG 的小波时频域图和格拉姆角场纹理图,并送入所提出的集成深度学习模型进行识别,经过在波恩大学的癫痫脑电数据集测试表明:集成深度学习模型的性能要优于单纯的1 维CNN,说明将EEG 转换成2 维图像再进行识别是确实可行的方法;集成深度学习模型的性能要优于单2 维CNN,说明小波时频图和格拉姆角场图的结合可以提高癫痫EEG 的识别性能。

猜你喜欢
格拉姆小波时域
OFDM 系统中的符号时域偏差估计
改进的浮体运动响应间接时域计算方法
构造Daubechies小波的一些注记
基于Haar小波的非线性随机Ito- Volterra积分方程的数值解
基于MATLAB的小波降噪研究
基于复杂网络理论的作战计划时域协同方法研究
坚守梦想的英格拉姆
布兰登·英格拉姆 三重威胁
网络分析仪时域测量技术综述
有本事的男人