抑郁症EEG诊断的类脑学习模型

2024-03-03 11:21曾昊辰关治洪
计算机工程与应用 2024年3期
关键词:连接性类脑脑区

曾昊辰,胡 滨,关治洪

1.华中科技大学 人工智能与自动化学院,武汉 430074

2.华南理工大学 未来技术学院,广州 510641

3.人工智能与数字经济广东省实验室(广州),广州 510335

抑郁症是一种全球性精神障碍疾病,其终生患病率相对较高,从2%到15%不等,并且与显著的发病率有关[1]。世界卫生组织的数据显示,全球估计有3.8%的人口受到影响。不同于通常的情绪波动和短暂情绪反应,当抑郁症反复发病并达到中度或重度时,可能引发严重的健康疾患,甚至导致自杀倾向。然而,抑郁症发病机制尚不完全清楚,目前普遍认为是生物、心理、社会、季节等多因素综合干预下的产物。抑郁症本质上是异质的,不同抑郁症患者的症状与严重程度也可能是不一样的,不同亚型的抑郁症的症状也不同且亚组在不断变化。轻度抑郁症如果不及时发现并治疗,极有可能发展成中度甚至是重度抑郁症。因此,实现准确的抑郁症诊断是兼具实际意义和挑战性的课题。

目前,抑郁症诊断依赖临床症状,暂无任何无创或定量检测方法。主要基于症状学,根据是否出现抑郁症状来进行诊断。面对抑郁人群逐渐增多并且症状多样的诊断背景,传统诊断方法缺乏生物诊断根据、存在主观因素影响且量表无法有效进行抑郁症亚型与严重程度的判断,15 个国家或地区医生对抑郁症识别率仅有55.6%,而中国上海仅为21%,存在很大的误诊风险。深度学习(deep learning,DL)辅助诊断有望改善上述问题。深度学习是机器学习领域的一大分支,通过样本数据提取其特征并分析内在的规律。深度神经网络在图像、视频等任务上表现良好。在抑郁症诊断中,深度学习方法相比于传统的量表等检测手段,优势主要在于将复杂的抑郁症诊断问题转换成建模计算的量化问题,排除了主观因素影响准确性更高,同时从患者的磁共振、脑电等生理信号提取抑郁症特征,具有一定的生理依据。

王凤琴等[2]通过卷积神经网络(convolutional neural network,CNN)为核心的在线脑电分类系统能实现抑郁症与健康个体分类的准确率、敏感度和特异度达到99.08%、98.77%和99.42%。IBM 团队[3]通过CNN 提取患者的语言方式进行分类,最终达到了83%的精确度。Achary 等[4]提出基于脑电图EEG 的卷积网络对15 名正常和15 名患者的脑电图进行测试,分别在左半球和右半球的EEG 信号上获得了93.5%和96.0%的准确度,并发现右半球的信号比左半球的信号更活跃。Uddin等[5]通过循环神经网络(recurrent neural networks,RNN)与长短期记忆(long short-term memory,LSTM)相结合研究患者的症状信息,精确度达到98%。Shah等[6]提出基于脉冲网络的NeuCube模型通过抑郁与健康EEG信号计算的神经回路连接进行分类,准确率分别为68.18%(EC)和72.13%(EO)。Uyulan 等[7]提出的基于EEG 信号的MobileNet架构产生了89.33%和92.66%的准确率,其中delta频段的效果最好。Mumtaz等[8]提出自动诊断架构,对抑郁症EEG信号分类准确度超过98.32%。

值得指出的是,基于深度学习的辅助诊断方法存在局限性,如模型大多难以训练,因为抑郁症特征难以有效提取导致数据中存在较多的无关噪声;模型的性能不足,因为医学隐私保护问题,数据集不够大,不足以支撑巨大的参数量,使得模型在泛化性、稳定性、鲁棒性上有很大不足,临床大规模应用能力有待提高;模型的生物可解释性不足,反映抑郁症生理学障碍机制的能力有限,训练过程产生的大量能耗与复杂度问题[9]也限制了进一步的临床应用。类脑学习方法有望克服上述局限性,提升临床辅助诊断效率[10]。

类脑学习是延伸机器学习的基本方法,新兴的具有生物可解释性的脑启发算法。类脑学习本质是通过计算与建模的手段,在软硬件协同下实现对大脑神经传导与认知机制的模拟,达到拥有人类智能水平的人工智能方法[11]。类脑智能系统的目标是具有信息处理机制上类脑、认知行为表现上类人、智能水平上达到或超越人等优势。类脑学习可分为三个层次:结构层次、器件层次与功能层次。处于类脑学习核心的脉冲神经网络,拥有更好的生物可解释性,并且能处理时间维度的信息;脉冲网络的连接具有稀疏性,并且是通过离散的脉冲信号传输信息。因此,构建基于脉冲神经网络的类脑学习方法,有望克服传统深度学习因高能耗难以应用于边缘设备的缺陷。

针对抑郁症临床诊断的需求及现有深度学习方法的局限,本文提出了一种用于抑郁症EEG 诊断的类脑学习模型,主要创新点如下:

(1)在功能层面,构建稀疏脉冲神经网络,对抑郁症EEG 信号实现高精度分类,并通过稀疏连接,降低分类任务的能耗,同时所建脉冲网络在样本较少情况下能够保证性能。

(2)功能层次的简单分类并不能直观地反映生理学障碍机制,进一步在结构层面,对患者的脑功能连接关系通过复杂网络分析建立脑连接空间拓扑,为抑郁症脑功能连接异常提供生理学线索。

1 研究方法

1.1 数据准备

数据来源基于兰州大学MODMA 数据集[12]记录的测试者5 min闭眼状态脑电图。参与者被要求保持清醒状态,并且保持没有任何身体运动,包括头部和腿部,以及任何不必要的眼球运动、扫视和眨眼。选取健康个体、轻度抑郁症患者各20 人的数据进行实验。数据预处理的方法如下:将初始128 通道信号滤波后去除干扰,包括肌肉收缩和运动伪影、眼球运动等导致的干扰,随后对去除的坏导进行重新插值,接下来进行电极重参考并对子空间重构去除高能成分。随后,将完成预处理之后的EEG 数据进行不同波段的滤出,包括δ(delta,1~4 Hz),θ(theta,4~8 Hz),α(alpha,8~12 Hz),β(beta,13~30 Hz),γ(gamma,30~40 Hz),全波段(1~40 Hz)。分别对不同波段的滤出EEG信号进行分析。

1.2 数据处理

脑是一个庞大的神经元网络,不同区域神经元的同步活动可以提供有关神经活动的有用信息,这被称为脑连通性。本文选择锁相值[13](phase-locking value,PLV)量化连通性。通过计算不同电极之间的锁相值,可以反映电极之间的相位同步性,从而衡量不同大脑区域之间的协调激活。锁相值的公式如下:

其中,N是窗口的数量,Δϕn表示第n个窗口的相位差。PLV值越接近1,表示两区域之间的同步性越强,连接性也就越强,反之,越接近于0,则两区域之间的相互独立性越强,连接性越弱。

实验采用128通道电极记录测试者的EEG信号,计算得到的脑邻接矩阵为128×128,假定连接性是无向的,为了减少输入参数量,对128×128 的矩阵取上半部分得到8 128维数据,去掉28个由参考或无关电极计算的元素得到90×90 的矩阵并转换为单通道图像作为神经网络的输入。

1.3 模型构建

模型从两个层次出发:在功能层次通过类脑计算学习抑郁症特征并进行准确的诊断,在结构层次对脑功能连接通过复杂网络分析找出EEG信号的相位同步性所反映的脑网络连接特性,找出生理学异常并进行潜在病因分析。

1.3.1 抑郁症的脉冲神经网络分类器

脉冲神经网络分类器由CNN通过FS(few-spikes)[14]编码转换而来,这种编码方式被证明能改善目前脉冲神经网络基于速率[15]及时间[15-16]的编码方式在能耗上及神经形态硬件应用的缺点,同时提升网络的延迟与吞吐量。CNN 已被证明在处理二维输入数据具有显著优势,首先在CNN上对EEG数据集进行训练,保存训练权重,再通过FS 转换保留原连接权重的情况下将卷积网络转换为脉冲网络。

CNN分类器结构如图1,卷积层卷积核均为3×3,过滤器的数量分别为32、64、128。选择ReLU函数作为激活函数。前两个卷积层后分别连接步长为1 的最大池化层,池化窗口为2×2,将最后一个卷积层展平(flatten)之后连接设置p为0.2的Dropout层。Dropout层连接着包含个46 208个隐藏节点的全连接层,全连接层的输出为2个节点。使用Adam算法进行训练。固定学习率为0.000 1,权值衰减系数为0.001,使用Xavier进行权重初始化,批量为128。

图1 卷积神经网络结构Fig.1 CNN structure

1.3.2 抑郁症的复杂网络分析模型

将初始的脑邻接矩阵转换为基于阈值的无向图应用复杂网络分析:在复杂网络分析中,平均路径长度L和聚类系数C分别对应于大脑功能组织的两个基本原则,功能整合和隔离[17]。功能整合反映了大脑组织与组合不同区域信息的能力,通过计算所有节点对之间的平均最短路径长度得到的特征路径长度L可以很好地衡量这一特性;功能分离反映了以特殊方式处理信息的能力,聚类系数C可以衡量节点的邻居之间存在连接的比例,不同脑分区节点聚类平均的结果可以反映分区的分离特性。

从平均路径长度与聚类系数出发,分别从小世界属性和平均聚类进行分析:

(1)小世界特性:小世界网络是一类特殊的复杂网络结构,对小世界特征的研究,通过计算与原始网络具有相同节点与连接性的随机网络的平均路径长度Lr与聚类系数Cr,并与原始网络的L值与C值对比,当C/Cr显著大于1,L/Lr接近于1 时,小世界网络特征是明显的。文献[18]定义了单一的标量小世界指数S量化小世界特征(当S值大于1时,网络表现小世界属性):

(2)电极平均聚类:对每个电极做平均聚类分析,通过电极采样的部位将不同脑区对应的一定数量电极的聚类系数平均得到不同脑区的平均聚类系数,比较患者与健康个体不同脑区聚类系数的差别,可以分析不同脑区的脑连接强弱与脑活跃程度。

2 研究结果

2.1 脉冲神经网络分类精度与能耗

本文所建脉冲神经网络分类器的性能如表1、表2,表1中,记录了FS编码前的分类精度,以及编码后的脉冲神经网络分类精度。表1、2 中每个波段实验的数据量均为400,神经元的个数均为136 384。

表1 脉冲神经网络分类器精度Table 1 Classifier accuracy of spiking neural network 单位:%

表2 脉冲神经网络分类器能耗Table 2 Classifier energy consumption of spiking neural network

神经网络通常需要足够的数据输入以提高性能,但在实际应用中必须考虑到医学数据隐私等导致的样本不足的问题,因此训练集大小为1 600,测试集与验证集均为200。表1、表2 的结果显示,较少的数据输入情况下网络的分类精度较高、能耗较低。

为了找出在分类任务中提取的抑郁患者与健康个体的分类特征,将每个batch 输入数据量设置为1,并且比较网络输出的最后一层特征图之间的差异:将患者与健康个体的特征图取任意10 张,计算二者之间平均结构相似指数SSIM 值(structural similarity index measure,SSIM),如表3。SSIM 通过提取图像的亮度、对比与结构特征比较图像之间的相似程度。取值范围在[−1,1]。

表3 分类器特征图结构相似指数Table 3 Structural similarity index of classification feature map

表3结果显示,除了δ波段的特征图差异不够显著,其余波段与全波段二者的结构相似指数都比较低,差异明显,将特征图差异可视化并标记差异位点。如图2所示,各个波段下提取的患者与健康个体的特征图差异比较明显,换言之通过随机样本提取的患者差异于健康个体的特征比较多,患者的脑活动异常较明显。如果将特征图差异区域映射到对应脑区,可以得到相关脑区的异常情况。但是神经网络信息传输存在失真,在卷积层、池化层不断地提取特征时数据会受到一定程度的损失,特征图特征是缺失的,这不利于映射到相关脑区的生理学分析,因为存在部分脑区电极的像素点在传播过程中被裁剪的问题。因此对于更深层次生理学机制的分析,神经网络的特征图并不能准确地、无失真地分析出患者与健康的脑功能连接差异性,因此,对脑连接作进一步的复杂网络分析是必要的。

图2 各波段输出层抑郁与健康特征图差异可视化Fig.2 Visualization of difference between depression and health feature maps in output layer of each band

2.2 复杂网络特征

将脑功能连接矩阵基于连接阈值转换为无向图,如图3,节点表示位于不同脑区的电极,不同颜色表示不同脑区;节点之间的连线表示不同脑区之间的功能连接,连线的稀疏性表示脑区的活跃程度。对比患者与健康结果,以额中线及左前额线为例,静息状态下,患者与健康个体相比在此脑区活动减弱;在右额叶区患者的脑活动增强。构建与原始无向图具有相同连接矩阵的随机图,分别比较二者的图特征,如表4~表6。

表4 聚类系数比值(C/Cr)Table 4 Ratio of clustering coefficients(C/Cr)

表5 平均路径长度比值(L/Lr)Table 5 Ratio of average path length(L/Lr)

表6 平均小世界指数STable 6 Mean small world index S

图3 将脑邻接矩阵转换为基于阈值的无向图Fig.3 Converting brain adjacency matrix to threshold-based undirected graph

为了建立相关脑区与实验电极之间的有效映射,划分出不同脑区的电极编号,如图4。脑区编号如下:MpF前额中线、LpF左前额叶、RpF右前额叶、LF左额叶、RF右额叶、MF额中线、LT左颞、RT右颞、MC中线中央、LP左顶叶、RP 右顶叶、MP 中线顶叶、LO 左枕骨、RO 右枕骨、MO枕中线。

图4 实验用到的128电极空间拓扑Fig.4 Spatial topology of 128 electrodes used in experiment

对不同脑区内所有电极作平均聚类分析,如图5,横轴为脑区编号,纵轴为患者该脑区平均聚类系数与健康个体的差值,纵轴的正半轴以上曲线表示患者该脑区集聚特征增强,纵轴的负半轴以下曲线表示患者该脑区集聚特性减弱,虚线表示二者差的阈值(0.02),超过这一阈值说明在相关部位的平均聚类系数出现异常。

图5 分波段不同脑区平均聚类系数差Fig.5 Differences in average clustering coefficients of different brain regions in sub-bands

2.3 结果分析

本文提出的脉冲神经网络,能实现抑郁症EEG 信号的分类,具有高精度、低能耗及良好的泛化性能。为进一步测试模型的性能,在同一数据集δ 波段下,选择文献[19]提到的五类深度神经网络模型,包括LeNet、VGG11、VGG16、GoogLeNet、ResNet18,对比测试模型的准确率与参数量。在功耗方面,将上述五类网络基于频率编码转换为权重不变的脉冲神经网络模型,分别计算转化模型的准确率与脉冲数,对比结果如表7,括号内精度为对应的脉冲网络精度。对比显示,本模型使用了最少的参数量使得对抑郁症的识别精度达到了97.5%,精度高于LeNet、VGG11、GoogLeNet。对比VGG16、ResNet18 的性能,尽管精度略低,但是相比使用的参数量要少得多,收敛速度也更快,训练成本更低。尽管发放脉冲数多于LeNet,但是相较LeNet,模型的精度有了较大的提升,同时对比其他方法转换的脉冲神经网络,在高精度识别的前提下,模型发放脉冲的数量最少,能耗最低,实现了高精度少参数与低功耗的效果,有较好的实用性。

表7 相关方法性能对比Table 7 Performance comparison of related methods

同时对脑功能连接作复杂网络分析:在α、β、θ 波段,健康个体与患者差距较大。α波段患者聚类系数较高,在此波段有较高的脑活动水平,而α 波与潜意识的活动密不可分[20],高水平的此活动可能会导致无法集中注意力;在β波段结果则相反,β波在认知推理等有意识的思考活动方面有积极的影响[21],低水平的β 波会导致抑郁症、认知与注意力等能力差;在θ 波段患者表现出较强脑活动,这种频率较低的波与人们对原始情绪的感受与体验有关[22],过多的θ 活动可能会使人们出现抑郁症等症状。在β、δ、γ、θ波段患者表现出增加的平均最短路径长度,短路径长度确保大脑网络中有效的区域间完整性或及时信息传输,是认知过程的基础。疾病相关的路径长度的增加可能与用于信息传输的纤维束退化有关[23]。最后,在δ、θ、β波段的平均小世界指数显示,患者的大脑网络一定程度上偏离了小世界网络,这与神经影像学图形分析研究结果一致[24]。

患者与健康个体的脑网络均表现小世界特征,集聚系数较高而平均路径长度较低,很小的平均路径长度可以保证信息传导的及时性,信息传导完成的回路上激活的神经元较少,产生电脉冲信号因此较少;从另一个角度看,一个神经元被激活之后,由于神经回路上神经元数量很少,只会激活很少的突触后神经元,发出较少的脉冲数量,一定程度上这也可以说明脑网络的连接具有稀疏性。

对不同脑区的电极作平均聚类分析,可视化并验证计算结果,使用Matlab EEGlab工具箱对脑连接设定阈值之后进行可视化,以图6 为例:图5 中数据显示,左前额叶LpF 区beta 波段下,抑郁患者的集聚特性减弱,通过设定阈值可视化之后如图6(a)与图6(b),红圈内连线的稀疏性可以反映集聚特性。

图6 左前额叶LpF区beta波段对比Fig.6 Comparison of beta bands in LpF region of left prefrontal lobe

抑郁患者的脑功能连接性往往发生改变。在右颞区域的β 与θ 波段聚类系数较低,意味着这一区域的患者脑连接减少,这可能是抑郁症右后岛叶和一系列感觉皮层之间的功能连接性显著降低导致的[25],也可能是[26]颞上回的连接性下降,但在左颞区域出现反常,患者在γ与α 波段展现了较强大脑活动。在左前额叶皮层,β 波段聚类系数较低,此区域患者脑功能连接减少,这与患者背外侧前额叶皮层大脑活动减少[27]的结论一致。在顶叶区域,γ 波段的顶叶中线与右顶叶表现出很强的连接性,在左顶叶区域,α 波段表现出高连接性,这与文献[27]提到的楔前叶和后扣带回活动减弱似乎矛盾,同时[28]患者楔前叶和额颞叶区域与健康个体有巨大差异。在额叶区域,左右额叶的表现完全相反,在右额叶区,波段均表现出低聚类特性,意味着这一区域连接性下降[29];在左额叶区γ波段表现出高聚类特性,这有可能是膝下扣带回-丘脑连接上升[27]产生的逆转。在左右枕骨区,右枕骨在γ、α、β 波段都展现了较高的聚类特性,这预示着抑郁症患者的右枕骨区连接增强;在左枕骨区只在β波段连接性较强。

患者在γ波段多个脑区均展现出高水平脑活动,而γ 波健康认知、精神障碍有关[30]。右半球的患者与健康个体差异明显,在右前额叶、右额叶皮层、右颞皮层、右顶叶皮层、右枕骨区域都展现了集聚系数反映的连接性差异。

本文的创新点如下:针对医学背景下隐私数据少引起的低性能问题,通过简化输入、减少参数量并且设置Dropout层,使得在样本量减少的情况下,精度仍然能达到高水平,并且有良好的泛化性、稳定性与鲁棒性;针对高能耗问题,构建了基于脉冲网络的抑郁症EEG 分类器,显著降低了分类任务的能耗;针对诊断中缺乏生理依据的问题,结合复杂网络分析为抑郁症脑活动异常提供定量分析的支持。此外,本文研究的不足之处包括:模型的功能整合性不强,需要结合脉冲网络分类器与复杂网络分析从两个层次进行分析,模型的即时性与效率不够;数据处理相对繁琐,而实用场景下的辅助诊断需要快速、精确地进行;采用单模态,抑郁症是一种异质性疾病,只采用EEG 信号作为单一模态在应对实际复杂诊断环境时并不完全适用,结合多模态的数据对抑郁症及严重程度进行量化评估将是未来改进工作的主要方向。

3 结束语

本文提出了一种基于类脑学习的抑郁症EEG诊断及分析模型,分别从功能与结构两个层面对抑郁症个体的功能脑网络特性进行分析。首先,通过提取抑郁症患者EEG信号的特征,量化分析电生理的脑连接信息,提取抑郁症与健康个体的差异特征;其次,构建具有较高精确度与类脑性能的脉冲网络分类器,并结合复杂网络,建立脑连接的空间拓扑分析潜在的病因,从平均聚类与特征路径长度出发,分析功能脑网络的小世界特性与平均集聚特性,为抑郁症的病理障碍溯源提供可能线索。

猜你喜欢
连接性类脑脑区
脑自发性神经振荡低频振幅表征脑功能网络静息态信息流
神经元规模最大类脑计算机问世
基于多尺度网格细胞模型的无人机类脑矢量导航方法
亚洲航运港口网络连接性分析
中国成立“类脑国家实验室”“借鉴人脑”攻关人工智能
说谎更费脑细胞
七氟烷对幼鼠MAC的测定及不同脑区PARP-1的影响
Imagination的Ensigma Whisper核:适用于可穿戴设备与物联网的业界最低功耗连接性IP
Whisper架构为物联网和可穿戴设备连接性IP设立新标准
CommunicAsia2014、EnterpriselT2014和BroadcastAsia2014:移动性和连接性成为众人瞩目的焦点