基于分层多模板匹配的乳腺肿块自动检测

2013-12-22 08:05徐胜舟胡怀飞
关键词:敏感度灰度肿块

徐胜舟,胡怀飞

(1 中南民族大学 计算机科学学院,武汉430074;2中南民族大学 生物医学工程学院,武汉430074)

乳腺X线摄片被认为是目前乳腺癌最常用和有效的诊断手段之一.全世界每年要产生大量的乳腺X线摄片,然而,由于放射科医师的视觉疲劳或者人为疏忽,有10%~30%的可探测乳腺癌并不是开始就被检测到并被解释为乳腺癌[1].因此,设计一种基于乳腺X线摄片的计算机辅助检测(CAD)系统帮助医生进行辅助诊断显得尤为重要.

国内外众多研究者在乳腺肿块CAD方面展开了大量的研究[2,3].这些肿块检测方法的过程大致可以分为两个阶段[4]:初始检测和假阳性去除.初始检测需检测尽可能多的可疑肿块,保持高敏感度;假阳性去除阶段则需识别并去掉大多数假阳性.根据初始检测方法,可以将肿块检测方法分为基于像素和基于区域的两类.前者从每个像素上提取特征,而后者则从可疑区域中提取特征.基于区域的方法考虑了空间信息,其诸如区域的形状和边缘等特征与重要的诊断信息直接相关且计算量相对较小,因而得到更多的应用.例如,Zheng和Nevine等人分别提出了基于三层地形模型[5]和多层地形模型[6]的检测方法,这两种方法均认为肿块区域中心灰度最高并向四周逐渐降低,并通过多阈值来逐层分割和识别可疑肿块.Polakowski[7]则使用差分高斯函数(DOG)方法对肿块进行定位.

本文首先利用乳腺X线摄片灰度分布的先验信息,采用基于直方图分析的阈值法分割出乳房区域.然后,针对乳腺肿块的灰度分布及形态学特点,采用两个不同大小的Sech模板来分层匹配可疑区域,并在此基础上提取层间特征、灰度特征及形态学特征以区分假阳性区域.实验结果表明本文方法能够在保证高敏感度的同时保持较低的假阳性率.

1 乳房区域分割

图1 乳腺X线摄片及其灰度直方图

为提高肿块检测的效率并避免由背景区域中的一些噪声(如标签等)而引起的假阳性,应首先对乳腺图像进行分割以去掉背景的影响.典型的乳腺X线摄片(如图1(a))的内容可分为乳房区域和背景区域,其中乳房区域包括:胸壁、腺体组织及皮下脂肪.由于部分肿块的位置靠近皮下脂肪区,因而需要准确分割出皮下脂肪,而皮下脂肪区域的灰度与乳房区域的灰度差别比较大,更接近于背景区域,因而增加了分割难度.在典型的乳腺X线摄片中背景区域的灰度值较低且其分布具有较好的一致性,在直方图上表现为靠左端的最高峰(如图1(b)).而皮下脂肪区域则对应分布在靠近这个最高峰的右侧的局部峰值.基于此先验信息,我们设计一种直方图分析法来对乳房区域进行分割.首先,找到直方图中的对应于背景部分的最高峰,并以此最高峰的位置作为搜索起始值,顺序搜索乳腺X线片的灰度空间,找到最高峰右侧的第一个灰度低谷位置,该位置即代表了背景与乳房区域的分界值.以此低谷值作为灰度阈值,对乳腺X线片进行阈值分割.

图2 乳房区域分割结果

图1(b)中的T1、T2、T3、T4分别为原始Otsu分割算法、灰度剖面图结合Otsu的分割算法[6]、限制灰度范围的Otsu分割算法[8]以及本文分割算法所得到的分割阈值.图2则对应给出了这四种分割方法的分割结果.从图中可以看出:原始Otsu阈值分割的乳房区域存在明显的欠分割现象,脂肪区域没有被正确地分割;两种改进后的Otsu方法对欠分割现象有一定的改善,但仍然存在,而本文的直方图阈值法则能很好地找到完整的乳房区域,为后续的肿块检测提供良好的基础.

2 乳腺肿块检测

模板匹配是一种常用的目标定位方法,它通过定义与目标相似的模板,计算模板与子图像的相似度来寻找目标.该方法的关键是建立恰当的模板.考虑到乳腺X线摄片中肿块区域通常表现为在区域中心附近的灰度值最高并向四周逐渐降低,其形状大致类似圆形,且由于和周围组织的灰度差异而产生一定的对比度.本文设计了3种具有与肿块相似特征的模板,分别定义如下:

Sech模板:

s(x,y)=

(1)

Gauss模板:

g(x,y)=exp(-(x2+y2)/2σ2),

(2)

Sphere模板:

(3)

以模板中心为原点,x,y分别表示横、纵坐标.β、σ和r分别为控制模板的灰度由中心到边缘的变化速率的参数.设L为模板每边上像素个数,3种模板在各自的中心处的灰度取得最大值:s(0,0)=g(0,0)=p(0,0)=1,在离中心的距离为L/2的边缘处的像素的灰度取得最小值.图3给出了一个真实肿块的灰度分布以及上述3种模板在尺寸为33×33时的灰度分布图,其中β、σ和r的值分别取0.08、8和16.

图3 乳腺肿块及3种模型的灰度分布

模板与子图像的匹配相似度直接影响到乳腺肿块检测的结果,这里采用归一化的互相关(NCC)来度量.假设T表示模板图像,I表示待检测图像,μT表示模板图像的平均灰度,而μI(i,j)表示以(i,j)为中心的子图像区域的平均灰度,记T′(i′,j′)-μT,I′(i+i′,j+j′)=I(i+i′,j+j′)-μI(i,j),其中i′=0,…,L-1,j′=0,…,L-1表示模板与图像重叠区域,则待检测图像在(i,j)处的匹配结果R(i,j)可表示为:

R(i,j)=

(4)

其中:

按公式(4)计算每个像素点处的相似度值,构造一幅相似度图像.在该图像中,肿块区域由于与模板具有高相似度而具有高灰度值.因此,对此图像其进行阈值分割即可定位出原图像中的可疑区域.

当模板与肿块大小有显著差别的时候,相似度较低,而事实上乳腺肿块大小各异.因此,若采用固定大小的模板进行匹配,则难以同时保证高灵敏度和低假阳性率.考虑到乳腺肿块具有中间灰度高,周围灰度逐渐降低的类似分层的特点.本文提出一种分层多模板匹配的方法,即先用小尺寸模板匹配肿块的中心区域,由于小模板具有高敏感度,匹配结果可检测到绝大多数的可疑区域,但是其中同时包含有较多的假阳性;再用大尺寸模板进行肿块区域匹配,大模板检测到得可疑区域数目相对较少,可能会漏掉一些肿块,但是大模板检测得到的可疑区域为肿块的可能性相对更高,且大模板也可能检测到小模板漏检的肿块;最后综合两者的检测结果.这样既可以获得更高的敏感度,减少肿块漏检的情况,也同时突出了那些由大模板检测出来的可疑性较高的区域,便于与假阳性区域相区分.

为比较上述3种类型的模板对不同大小的肿块的敏感性,随机选取70个不同大小的肿块,对上述3种类型模板,每种设计13种不同尺寸(从17×17到65×65)的模板并分别与每个肿块相匹配,计算匹配相似度,然后统计各种模板在不同尺寸下与70个肿块相匹配的平均相似度值.结果如图4所示.

图4 3种模板在不同尺度下匹配结果比较

从图4可以看出,在各种尺寸下,Sech模板相对于同尺寸的Gauss模板和Sphere模板具有更高的匹配相似度,即Sech模板能够检测出更多的可疑肿块,可减少肿块的漏检.因此,本文选用Sech模板来进行多尺度模板匹配.另外,从统计结果可看出:对于各种不同大小的肿块,Sech模板的尺寸为33×33左右时其匹配平均相似度最高,因此小模板的尺寸设为33×33,而大模板的尺寸则设为65×65.多尺度分层匹配的具体步骤如下.

Step1.用一个小Sech模板对肿块区域进行匹配,对匹配结果进行阈值分割得到可疑区域.

Step2.用一个大Sech模板对肿块区域进行匹配,对匹配结果进行阈值分割得到可疑区域.

Step3.对两次匹配的结果进行加权,且给大模板的匹配结果以稍高的权重将两次匹配的结果合并,取两者中匹配值较大者作为结果图像的灰度值.

Step4.对合并后的结果做适当的形态学膨胀变换,使得匹配结果更接近真实肿块.

图5给出了多尺度Sech模板匹配过程:图5(a)是一幅包含肿块的乳腺X线摄片,图5(b-c)则是分别是用小模板和大模板对其进行检测的结果,图5(d))是加权合并之后做适当的形态学膨胀变换的结果.

图5 多尺度模板匹配

对上述检测结果:采用基于动态规划的分割算法[9]对其提取轮廓;提取包括层间特征、灰度特征及形态学特征在内的10个特征;将这些特征输入到事先设计好的Fisher分类器中,对可疑肿块是否为真阳性做出判断.

3 实验结果及分析

对DDSM数据库[10]中的153位病患者某侧乳腺组织的轴位(简称CC)视图和侧斜位(简称MLO)视图共306幅乳腺X线摄片进行实验.每个患者的该侧乳腺组织已被确诊包含有一个肿块病灶,且肿块病灶信息均已被放射科医师记录下来.图6所示是应用本文的检测方法对一幅轴位视图(左)和一幅侧斜位视图(右)进行检测得到的结果,图中白色边界区域表示检测出的真阳性区域,黑色边界区域表示检测出的假阳性区域.

图6 对两个病例图像的检测结果

为全面评估本文肿块检测算法的性能,实验过程中采用自由响应的受试者操作特性曲线(FROC Curve)对算法进行性能测试.为比较单模板匹配与多尺度模板分层匹配的效果,图7给出了分别采用小模板、大模板、分层多模板进行匹配的FROC曲线.

图7 FROC曲线

由于乳腺CAD在临床应用中首先要保证较高的敏感度,表1列出了3种模板匹配方法敏感度在70%以上时的假阳性率.从图7和表1中可以看出,多尺度模板匹配方法不仅能够获得更高的敏感度,而且在相同的敏感度下其假阳性率更低.

表1 模板匹配性能比较

文献[6]中在DDSM数据库中的由“LUMISYS”数字转换器得到的270幅轴位视图数据集上进行训练和测试的,其敏感度在92%,88%,81%时对应的平均每幅图像上的假阳性个数分别为5.4,2.4,0.6.另外,对于同样在DDSM上进行测试的肿块检测算法: Catarious等人[2]在83幅图像上进行测试,算法的敏感度保持在92%时,其假阳性率为每幅图像5.2个.Masotti等人[11]的算法则在敏感度为70%时其假阳性率为平均每幅图像0.92个.而本文则在DDSM中由“LUMISYS”数字转换器得到的306幅包括轴位视图和侧斜位视图(侧斜位视图通常因为包含较大的胸壁区而假阳性率更高)的数据集进行测试,其结果在敏感度为92%,88%,81%时假阳性率分别为3.2,2.3,0.7.而且,而本文的最高敏感度可达95%,同时保持平均每幅图像只有3.8个假阳性.可见,本文基于多尺度模板匹配的肿块检测算法确实是一种行之有效的检测方法.可有效地辅助医生提高乳腺癌检测的精准度和效率.

[1]Burhenne LJ W,Wood S A,D′Orsi C J,et al.Pote ntial contribution of computer-aided detection to the sensitivity of screening mammography[J].Radiology,2000,215: 554-562.

[2]Catarious D M,Baydush A H,Floyd C E.Characteri-zation of difference of Gaussian filters in the detection of mammographic regions[J].Medical Physics,2006,33 (11): 4104-4114.

[3]Yuan Y D,Giger M L,Li H,et al.A dual-stage method for lesion segmentation on digital mammograms[J].Medical Physics,2007,34(11): 4180-4193.

[4]Sampat M P,Markey M K,Bovik A C.Computer-aided detection and diagnosis in mammography[M].2nd ed.New York: Academic,2005:1195-1217.

[5]Sang C P,Pu J T,Zheng B.Improving performance of computer-aided detection scheme by combining results from two machine learning classifiers[J].Academic Radiology,2009,16(3):266-274.

[6]Eltonsy N H,Tourassi G D,Elmaghraby AS.A concen-tric morphology model for the detection of masses in mammography[J].IEEE Transactions on Medical Imaging,2007,26(06):880-889.

[7]Polakowaki W E,Cournoyer D A,Rogers S K,et al.Computer-aided breast cancer detection and diagnosis of masses using difference of Gaussians and derivative-based feature saliency[J].IEEE Transactions on Medical Imaging,1997,16(6):811-819.

[8]许向阳,宋恩民,金良海.Otsu准则的阈值性质分析[J].电子学报,2009,37(12):2716-2719.

[9]Song E M,Xu S Z,Xu X Y,et al.Hybrid Segmentation of mass in mammograms using template matching and dynamic programming[J].Academic Radiology,2010,17(11):1414-1424.

[10]Heath M,Bowyer K,Kopans D,et al.The digital database for screening mammography[C]// Yaffe M J.Proceedings of the Fifth International Workshop on Digital Mammography.Berlin: Springer-Verlag,2001.

[11]Masotti M,Lanconelli N,Campanini Renato.Compu-ter-aided mass detection in mammography: false positive reduction via gray-scale invariant ranklet texture feature[J].Medical Physics,2009,36(2):311-316.

猜你喜欢
敏感度灰度肿块
采用改进导重法的拓扑结构灰度单元过滤技术
假体周围感染联合诊断方法的初步探讨*
颈部肿块256例临床诊治分析
一种基于属性的两级敏感度计算模型
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
乳腺假血管瘤样间质增生1例并文献复习
Arduino小车巡线程序的灰度阈值优化方案
乳房有肿块、隐隐作痛,怎么办
下尿路感染患者菌群分布及对磷霉素氨丁三醇散敏感度分析
年龄相关性白内障患者超声乳化手术前后对比敏感度分析