基于SAE的MRI图像检索系统

2016-04-09 02:03广东工业大学自动化学院连伟烯
电子世界 2016年5期

广东工业大学自动化学院 连伟烯



基于SAE的MRI图像检索系统

广东工业大学自动化学院 连伟烯

【摘要】提出了一种根据医学专有名词作为语义对具体人体组织进行检索的MRI图像检索方法。在构建图像检索系统的特征提取方法上,采用了稀疏自动编码器模型,并通过多个稀疏自动编码器的堆叠构建了深度学习网络,最后采用BP分类器构建了整个MRI图像检索系统。实验结果表明,层叠自动编码器对于MRI图像的高层特征具有很好的提取能力,同时避免人工选择特征提取方法上的主观性,具有较好的适应性。

【关键词】基于语义的图像检索;自动编码器;稀疏编码;层叠自动编码器

0 引言

在当前情况下,医院的影像科获取到的全部MRI图像主要是依靠人工方式进行分类保存。按照这个方式在检索图像时,在应用过程就会有很多困扰:(1)在一次MRI成像中,我们需要从中找到感兴趣区域,这就需要从这些断层图像中找到包含感兴趣区域的图像,再确定图像中感兴趣区域的位置。(2)随着MRI图像数据的膨胀,使得对MRI图像的管理和存储越来越困难。

基于语义的MRI图像检索系统是一种直观、便捷、灵活的工具。利用医学名词上的语义定义,可迅速从MRI图像中找到所属的感兴趣区域。首先,通过检索可从众多MRI图像中找到包含对应感兴趣区域的MRI图像。其次,从这些MRI图像中标注出该感兴趣区域。这些都有利于医生在诊断工作中减少相关工作量。本文提出一种基于层叠自动编码器(SAE,Stacked AutoEncoder)的MRI图像检索方法,该方法使用SAE作为图像的特征提取工具,再结合BP分类器完成语义上的分类检索工作,并进行相关的实验分析工作。

1 基于SAE的MRI图像检索系统结构

本文的图像检索系统主要分为两个模块:特征提取和查询模块[2]。如图1所示。该图像检索系统主要完成两个方面的内容:(1)对图像数据中包含对应语义的MRI图像的检索;(2)对检索结果的MRI图像对应语义内容的区域进行标识。其中,预处理步骤包括:(1)对不同尺寸大小的MRI图像进行格式和尺寸大小的统一;(2)对MRI图像进行分块。特征提取步骤是对分块图像的特征提取,本文采用无监督学习的SAE方法进行特征提取并建立模型。在查询模块中,用户使用指定的语义对欲查询图像数据进行查询,图像数据在建立的特征提取模型进行特征提取,并采用BP网络对所提取的特征分类,最终返回符合语义的MRI图像。

图1 图像检索系统结构

1.1SAE特征提取方法

SAE是一种无监督学习的深度学习网络模型。通过对若干自动编码器(AE,AutoEncoder)的级联构成多层神经网络,它的输出可看作是输入数据经过多次降维后的特征表示[3-5]。AE是一种单隐层无监督学习神经网络,通过对输入信号的近似复现,从而得到输入信号的表示,即特征。

利用线性代数中基的概念,即:

在自动编码器的基础上加上一些L1的Regularity限制,这时公式(1)可以写为:

此时我们得到即为稀疏自动编码器(Sparse AutoEncoder)。

把有m个输入向量的稀疏编码代价函数定义为:

其中第一项是重构输入数据x的代价值,它迫使稀疏编码算法能为输入向量x提供一个高拟合度的线性表达式,第二项即“稀疏惩罚”项,S(.)是一个稀疏代价函数,由它来对远大于零的进行“惩罚”,它使x的表达式变得“稀疏”。常量λ是一个变换量,由它来控制这两项式子的相对重要性。在实际中,稀疏代价函数S(.)的普遍选择是L1范式代价函数及对数代价函数。

为了使分解系数中只有少数系数远远大于0,而不是大部分系数都比0大。我们对基集合中的值也做了一个约束。因此,在公式(3)的基础上,要满足:

对于无稀疏约束时网络的损失函数表达式如下:

其中,第一项和第二项分别为输入输出的均方误差约束和权值衰减约束。m,分别表示样本数,网络层数和l层单元数W,b分别表示层间连接权重和l层的单元偏置。对于有稀疏约束的网络,需要在损失函数中加入一个额外的惩罚因子,这个罚因子基于相对熵 (KLdivergence):

1.2SAE结合BP分类器的MRI图像检索实现

SAE作为MRI图像的特征提取工具,本身不具备分类检索功能,要实现该功能,需要分类器对体征提取结果进行分类[7]。本文采用了BP神经网络实现MRI图像检索的分类工作。利用SAE提取图像的底层特征作为网络的输入,用语义期望值作为网络的输出,并用BP算法来训练该网络。具体步骤如下:

(1)用大量无标签原始输入数据作为输入,利用稀疏自动编码器训练出第一个隐含层结构的网络参数,并将用训练好的参数算出第一个隐含层的输出。

(2)根据SAE隐含层的层数重复步骤1,即将上一个隐含层的输出作为下一个隐含层的输入,逐层训练。

(3)将SAE最终的输出作为多分类器BP网络的输入,然后利用原始数据标签来训练出BP的网络参数。

(4)计算隐含层和BP分类器整个网络的代价函数,以及整个网络的对每个参数的偏导函数值。

(5)用步骤1、2和3的网络参数作为整个网络初始化的值,然后利用梯度下降法迭代求出代价函数最小值附近的参数值,作为整个网络的最优参数值。

2 实验结果与分析

本文训练和测试数据图像采用十组真实病人的大脑MRI图像。我们对MRI图像进行分块,并对分块分为眼球、脑干、面听神经、小脑、轮廓、其他这5类语义进行标注,共有35604个数据,其中3000个作为测试数据。

实验分别构建了包含三层、四层和五层AE所级联构成隐含层的基于SAE的MRI图像检索系统。其中,三层隐含层的节点数分别为1500、800、200,四层隐含层的节点数分别为1500、800、400、200,五层隐含层的节点数分别为1500、1200、800、400、200。测试的结果如表2.1所示。

表2.1

实验结果表明,基于SAE的MRI图像检索系统能够达到较好的准确率,同时也表明了准确率随着网络隐含层层数的增加而增加,这体现了SAE深度学习网络可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力[8]。随着层数的增加,将样本在原空间的特征表示变换到一个新特征空间,形成更加抽象的高层表示属性类别或特征,从而使分类或预测更加容易。

3 结论

本文提出了采用基于深度学习的SAE网络作为MRI图像的无监督特征提取工具,并进行了相关的实验。实验结果表明,采用深度学习的SAE网络能够避免人工选取特征提取方法,从层叠的深层网络中提取到更高层次的特征表达,由于其无监督的特性,因而具有较强的适应性,结合BP分类器,能够达到很好的检索效果。

参考文献

[1]N.Kumaran,R.Bhavani.MRI Image Retrieval Using Gabor Wavelet Based Texture Features.International Journal of advanced research in Science and Technology.Volume.2, Issue 1,2013,pp40-45.

[2]马冬梅.基于深度学习的图像检索研究[D].内蒙古大学,2009.

[3]G.E.Hinton,R.R.Salakhutdinov.The.Reducing the dimensionality of data with neural networks.Science 28 July 2006:454-455.

[4]杜骞.深度学习在图像语义分类中的应用[D].华中师范大学,2014.

[5]林少飞,盛惠兴,李庆武.基于堆叠稀疏自动编码器的手写数字分类[J].微处理机,No.1 Feb.,2015,47-51.

[6]敖道敢.无监督特征学习结合神经网络应用于图像识别[D].华南理工大学,2014.

[7]曲建岭,杜辰飞,邸亚洲,高峰,郭超然.深度自动编码器的研究与展望[J].计算机与现代化,2014,(8):128-129.