结合区域信息的双抑制FCM聚类图像分割

2022-06-23 11:11胡天隆
计算机工程与设计 2022年6期
关键词:灰度阈值聚类

兰 蓉,胡天隆,赵 强

(西安邮电大学 通信与信息工程学院,陕西 西安 710121)

0 引 言

图像分割就是将一幅图像按照颜色、灰度、纹理等划分成若干个具有不同特性的区域,并分离出感兴趣区域的过程[1,2]。在众多图像分割算法中,模糊C均值(fuzzy C means,FCM)聚类算法的应用最为广泛[3]。然而,经典的FCM算法具有收敛速度较慢[4]以及像素误判等问题。针对上述问题,国内外学者从不同的角度对FCM算法进行改进。Lei等引入形态学重构操作,提出了一种快速鲁棒的图像分割算法[5]。Huang等结合超像素算法改善FCM算法处理高分辨率遥感影像时的性能[6]。Kashif利用区间2型模糊集进一步提高FCM算法处理不确定性信息的能力[7]。Fan等基于竞争学习的思想,提出了抑制式模糊C-均值(suppressed fuzzy C-means,SFCM)聚类算法[8],但未解决抑制因子的自适应选取问题。

为了实现对SFCM算法中抑制因子的自适应选取,进一步提升算法性能,许多改进算法被相继提出。依据聚类有效性函数,Fan等提出了抑制因子的自适应选取算法[9]。Xiao等根据样本隶属度与样本所在位置间的关系,在添加约束条件的基础上改进了抑制因子的选取方式[10]。Yu等将可能性C均值聚类算法[11]与SFCM算法相结合,提出了抑制式可能性C均值聚类算法[12],该算法不仅可以实现抑制因子的自适应选取,同时改善了PCM算法的中心重合问题。

在上述算法中,FCM算法,结合超像素的改进算法和结合区间2型模糊集的改进算法并未对隶属度进行修改。其余改进算法,虽然对隶属度进行了修改,但修改过程只是简单的滤波或是令其向“两极”,即,0或1移动,并且大多仅利用了灰度信息,并未考虑像素点所属区域的信息,从而导致了相应算法的分割准确率较低,收敛性能较差。

基于以上问题,本文提出了结合区域信息的双抑制模糊C-均值聚类图像分割(double suppressed fuzzy C-means clustering image segmentation with regional information,DSFCM-RI)。首先,对图像进行初始区域划分,并提取区域信息;接着,利用图像区域信息对隶属度进行一次抑制;最后,结合区域信息与数据的分布特性,构建抑制因子的自适应选取公式,实现对隶属度的二次抑制。相较于对比算法,本文算法提高了图像的分割准确率,改善了收敛性能。采用本文算法对自然图像进行分割实验,实验结果及评价指标表明了DSFCM-RI算法的有效性。

1 相关工作

1.1 FCM聚类算法

给定数据集X={x1,…,xn}, FCM聚类算法基于最小化目标函数将X划分为c类,其目标函数为

(1)

式中:m>1是模糊指数,vi表示第i个聚类的中心,uij表示数据点xj对于第i个聚类中心的隶属程度,同时,由uij构成的U称为隶属度矩阵,即U=(uij)c×n。

由拉格朗日乘子法可得以下迭代公式

(2)

(3)

1.2 SFCM聚类算法

为了提高FCM算法的收敛速度,并保持良好的分类性能,Fan等提出了SFCM聚类算法,其主要思想是奖励样本的最大隶属度,同时抑制其它隶属度,具体过程如下。

针对式(2)计算的隶属度矩阵进行修正。设第d个样本为最大隶属度,即

(4)

那么

(5)

uij=αuij,i≠d

(6)

其中,α∈[0,1] 为抑制因子。

2 结合区域信息的双抑制FCM聚类图像分割

为了提高SFCM算法的分割准确率,并改善收敛性能,本文提出一种结合区域信息的双抑制FCM聚类图像分割算法。该算法针对现有改进的SFCM算法中仅考虑灰度信息导致的像素错分问题,首先利用区域信息对隶属度进行一次抑制,使本文算法获得更为理想的分割结果。此外,利用指数函数构造抑制因子的自适应选择公式,实现二次抑制,改善本文算法的收敛性能。

2.1 初始区域划分与区域信息提取

2.1.1 初始区域划分

本文基于边缘检测和形态学处理对图像进行初始区域划分,具体步骤如下。

步骤1 通过Laplacian算子[13]得到图像的边缘检测结果,并通过二值化阈值T强化不同区域的边界;

步骤2 采用闭操作[14]改善边缘连通性;

步骤3 进行孔洞填充[14],即,设定填充阈值FT, 对面积小于FT的区域判定为孔洞,进行填充;

步骤4 设定消除阈值ET, 对面积小于ET的区域判定为干扰数据,将其划分到面积较大区域;

步骤5 采用中值滤波对图像进行平滑。

至此实现了图像的初始区域划分,即实现了对原图像域的划分。

2.1.2 区域信息提取

计算各区域的极差与平均信息,分别由R1,R2和A1,A2表示,定义如下

(7)

(8)

其中,N1和N2分别为划分至区域S1和S2的像素数量。

区域位置、极差及平均信息共同构成区域信息。至此,完成了图像区域信息的提取。

2.2 结合区域信息的一次抑制

在SFCM算法及其改进算法中,大多仅考虑图像的灰度信息,易导致模糊划分矩阵中某些像素的隶属度发生偏移,从而出现误分割现象。本文算法利用区域极差信息构造修正因子的选取公式,并通过区域位置信息对分属不同区域的像素点的隶属度实现一次抑制,提高算法的分割准确率,具体如下:

第一步:对任意xj, 利用区域位置信息判断其所属区域;接着,通过隶属度矩阵判断在本次迭代中各区域所属类别。

第二步:若xj属于某一区域,则对该区域所属类别的隶属度进行奖励,对其它隶属度进行惩罚,称为一次抑制,公式如下

(9)

uij=β×uij,i≠g

(10)

其中,g代表一次抑制过程中区域所属类别,β代表修正因子,具体选取公式如下

(11)

式中:R1和R2由式(7)给出。

2.3 结合区域信息的二次抑制

在SFCM算法中,抑制因子α的取值将影响算法的收敛性能。本文将区域均值信息和数据分布特征相结合,构建指数函数型的抑制因子自适应选取公式,实现隶属度的二次抑制,具体公式如下

(12)

式中:σ是原始数据标准差,A1,A2是区域平均信息,由式(8)给出。

由于式(12)不涉及任何参数,因此,在实现自适应选取抑制因子的过程中,不会因为参数的人工设置影响图像分割的效果。

2.4 算法流程

相较于SFCM算法,本文提出的DSFCM-RI聚类图像分割算法将图像的区域信息引入聚类算法的迭代过程中,既能降低算法的迭代次数,又能提高分割准确率。算法具体流程如下:

DSFCM-RI

输入:数据集X,聚类数目c,模糊指数m,迭代终止阈值ε=1×10-5, 迭代次数k以及相关参数

输出:隶属度矩阵U,聚类中心V

步骤:

(1)对图像进行初始区域划分并运用式(7)、 式(8)提取区域信息。

(2)随机初始化隶属度矩阵U(k), 此时k=0。

(3)运用式(3)计算聚类中心V(k)。

(4)运用式(2)更新隶属度矩阵U(k+1)。

(5)运用式(9)~式(11)实现对隶属度矩阵的一次抑制。

(6)运用式(4)~式(6)和式(12)实现对隶属度矩阵的二次抑制。

3 实验结果与分析

为了验证本文算法的有效性,本节分别从4个方面检验并分析该算法的性能。首先,根据图像的分割视觉效果和量化指标对本文算法的分割性能进行分析;其次,分析二值化阈值T的选取对算法性能的影响;接着,验证采用区域信息的有效性;最后,通过迭代次数和运行时间的统计结果对本文算法的效率进行分析和说明。

实验环境如下:Windows 8.1;Intel Core i5;4 G RAM;MATLAB R2018a.

3.1 图像分割性能比较

为了客观验证本文算法的有效性,将经典图像以及Weizmann[15]图像作为测试图像,并与6种相关算法进行对比实验:FCM算法、SFCM算法、MShFCM算法、IPSFCM算法[10]、SPCM算法[11]以及FRFCM算法[5]。

实验中,本文算法的相关参数设置如下:由大量实验确定二值化阈值T=100; 填充阈值FT和消除阈值ET取经验值,分别为FT=IMT/16,ET=IMT/300, 其中IMT表示原图像面积。

3.1.1 性能指标

本文将从聚类指标和分割指标两个方面分别量化分析算法的有效性。

首先介绍2种聚类有效性评价指标:划分系数(partition coefficient,PC)[16]和划分熵(prtition entropy,PE)[16],定义如下:

(13)

(14)

其中,划分系数越大且划分熵越小,说明算法的聚类性能越好。

此外,对于分割有效性的评价,本文选用了以下2种指标,分别是:

分割准确率(segmentation accuracy,SA)[17]定义为

(15)

式中:AM表示经算法处理得到的属于第M类的像素集,GM表示标准分割中属于第M类的像素集,c为聚类数目,SA越接近1,表示分割结果越准确。其中,标准分割结果是由相关领域专家人工标注而成,已在相应图库中列出。

峰值信噪比(peak signal to noise ratio,PSNR)[18]是一种全参考的图像质量评价指标,定义为

(16)

(17)

其中,P(i,j) 和Q(i,j) 分别表示大小为B×D的标准分割结果和算法实际分割结果。PSNR值越大,图像分割效果越好。

3.1.2 经典图像的分割结果

本文选取eight、coins、house这3幅经典图像对相关算法性能进行测试。由于经典图像没有提供可以参考的标准分割结果,故通过实验可视化结果和聚类有效性指标验证算法的有效性。

图1(a)为原始图像,图1(b)~图1(h)分别为7种算法对eight图像的分割结果,其中,图1(h)为本文算法的分割结果。显然,大多数对比算法由于仅考虑了灰度信息,使得硬币反光部分区域产生了错误分割,而本文算法结合了区域信息,实现了对隶属度的一次抑制,避免了像素错分现象。值得注意是,FRFCM算法由于采用了形态学重建的方法得到了最好的可视化结果,但是由于隶属度滤波的影响,导致其聚类性能较差,由表1可知,本文算法具有最佳的聚类性能。

图1 7种算法对#eight的分割结果

表1 6种算法对经典图像的分割量化结果

图2为coins图像及7种算法的分割结果对比,其展示次序与图1一致。显然,一枚硬币由于表面灰暗导致其与背景的灰度值较为接近,是该图像的分割难点之一。对比算法均未能有效的将该枚硬币完整的分割出来,而DSFCM-RI算法能够利用区域信息对模糊划分矩阵进行修正,从而得到更为合理的分割结果。

图2 7种算法对#coins的分割结果

图3中,对比算法由于仅考虑灰度信息,故无法对房屋白漆部分及天空进行正确分割。本文算法结合区域信息,能够极大地减少白漆错分现象的产生,并得到更为接近原图的房屋轮廓。

图3 7种算法对#house的分割结果

由表1可知,与其它算法相比,DSFCM-RI算法由于自适应抑制因子,实现了对隶属度的二次抑制,故在两种聚类指标中均能保持一定的优势。

3.1.3 Weizmann数据库的分割结果

在3.1.2节中,由于经典图像无标准分割图像,仅对聚类性能进行量化分析。为了能够量化分析本文算法在分割性能上的优劣,选取Weizmann数据库[15]中的多幅图像进行测试。图4~图7给出了其中4幅图像经7种算法处理后的分割结果,表2列出了其聚类有效性指标和分割有效性指标,具体如下。

图4 7种算法对#1013的分割结果

图5 7种算法对#1051的分割结果

图6 7种算法对#2003的分割结果

图7 7种算法对#2051的分割结果

图4(a)为#1013原始图像,是一幅直升机图片,其中的螺旋桨和牵引绳由于形状较小且与背景灰度较为接近,是该图像的分割难点。图4(b)为标准类别标签所生成的图像,图4(c)~图4(i)是由7种算法处理后的分割结果。显然,大部分算法无法对易错分区域进行正确的分割,而本文算法通过引入区域信息,可对隶属度进行一次抑制,较为完整的分割出螺旋桨的整体形状,并且分割出牵引绳与直升机的连接部分,得到了与标准分割更为接近的结果。

图5~图7分别为#1051、#2003及#2051经7种算法处理后的分割结果,图像的展示次序均与图3保持一致。

图5中,原始图像的分割难点在于白鹭眼部及嘴部的灰度值与其自身灰度相差较大,目标局部较暗导致了误判情况的产生。由实验可知,对比算法对于错分区域并未产生明显改善,与标准分割存在差距;本文算法则取得了较为理想的效果。

图6中,对比算法由于仅考虑灰度信息,对于灰度值较为接近的沙滩与铺满沙粒的木板,无法完整分割出木板的形状,同时由于后方鸟类的嘴部及腿部过细,导致其也难以被完整分割;而本文算法利用区域信息修正像素隶属度,实现了对隶属度的一次抑制,有效改善了错分现象,得到较好的分割结果。

图7中,老鹰受自身羽毛颜色的影响,导致其头部与尾部区域的灰度值与自身灰度差别较大,因此对比算法无法正确分割出头尾区域,而本文算法在考虑灰度信息的基础上结合区域信息,使得头尾区域的错分现象得到了明显的改善。

表2 7种算法对Weizmann图像的分割量化结果

表2列出以上图像分割结果的性能指标值。由表2可知,本文提出的DSFCM-RI算法由于结合区域信息实现了对抑制因子的自适应选取,完成了对隶属度矩阵的二次抑制,故在大多图像上都获得了最佳的聚类性能,同时分割性能较对比算法也有所提高。

3.2 二值化参数选取

为了合理选取本文算法中二值化阈值T,并分析参数T对分割结果造成的影响,针对Weizmann数据库,本文以分割准确率作为指导,统计不同的T值对图像分割效果的影响,部分结果如表3和图8所示。

表3 参数T对分割量化结果的影响

图8 参数T对本文算法的影响

由表3可知,当T=100时,相应图像的分割准确率在部分情况下可以得到最优,或次优值。而当T取其它值时,分割准确率达到最优及次优的情况相对较少。

为了进一步说明阈值T造成的影响,根据表3绘制折线图,如图8所示。可以看出,T=50时,虽然在个别图像上取得了最优结果,但整体稳定性较差;T=200时,存在迭代无法收敛的情况;其余2种情况下,分割准确率较为稳定,皆保持在90%以上,但从整体效果和平均值可以看出,T取100时,得到了更为稳定和较好的分割结果。

结合表3、图8以及以上分析,针对Weizmann数据库,二值化阈值T=100是更为合理的选取结果。

经典图像的阈值选取方式与上述步骤相同,故不再详细说明。此外,可以看出当T值偏离最优取值时,图像的分割效果都会不同程度的受到影响。因此,针对不同图像选取出其最优T值,将会得到更为合理的实验结果,同时也可扩大图像的适用范围。如何自适应选取阈值T将是下一阶段的研究目标。

3.3 区域信息的作用

为了检验本文算法中的区域信息对于改善图像分割性能及聚类性能的有效性,选取对比算法中分割性能整体较好的MShFCM算法,将结合区域信息的一次抑制方法与其相结合,提出MShFCM-RI算法,并对#2001图像进行分割,实验结果如图9(d)所示。从图中可知,MShFCM-RI算法较原算法在分割结果上与标准分割结果更为接近,更为完整地获得螺丝的整体形状。

同时,为了客观验证区域信息对聚类算法的作用,将MShFCM-RI算法针对Weizmann数据库中的图像进行仿真实验,表4给出了3种算法对于该数据库中部分图像的平均性能指标测试结果。

由表4可知,添加区域信息后,由于对隶属度进行了一次抑制,MShFCM-RI算法的聚类性能虽然有所降低,可分割性能却较原算法有了明显提升,指标值甚至略高于本文算法。由此可见,结合区域信息的一次抑制在提升算法分割性能上具有一定的作用。

图9 区域信息影响

表4 区域信息对10幅图像的指标平均值的影响

值得注意的是,MShFCM-RI算法虽然分割性能较本文算法有稍许提高,聚类性能却仍有一定差距,这是由于抑制因子自适应方法的不同所造成的。这也在一定程度上印证了本文算法中结合区域信息的二次抑制亦可对聚类性能造成一定的影响。

3.4 算法运行效率分析

通常,迭代次数 (k) (单位:次)与执行时间 (t) (单位:s)是用来衡量聚类收敛性能与算法运行效率的指标。本文从Weizmann数据库中选取10幅测试图像对DSFCM-RI算法与对比算法的迭代次数和运行时间进行比较,具体数据见表5,统计结果的平均值则以直方图的形式呈现在图10中。

由于FCM算法在迭代过程中并未对隶属度进行修改,且其具有迭代次数多,执行时间短的特点,而SPCM算法也继承了PCM算法迭代次数多的特点,故FCM算法和SPCM算法不参与本小节的数据统计。

表5 5种算法对10幅图像的分割的迭代次数和时间统计

图10 5种算法对10幅图像分割的 平均迭代次数及执行时间

由表5可知,SFCM算法由于抑制因子采用固定值选取,迭代次数较高;MShFCM算法虽然改进了抑制因子的选取方式,但在迭代次数上并无明显优势;IPSFCM算法由于为抑制因子添加了约束条件,迭代次数有所减少;FRFCM算法由于采用了对隶属度进行滤波的方式,同样也能获得较少的迭代次数;而本文提出的DSFCM-RI算法结合区域信息实现了抑制因子的自适应选取,使算法的收敛性能得到了改善。

结合表5和图10中各算法的执行时间和平均执行时间可知,SFCM算法采用人工取值的抑制因子对隶属度进行修正,加速了算法收敛,耗时较短;MShFCM算法则实现了对抑制因子的自适应选取,在每次迭代中更新抑制因子,耗时更短;而IPSFCM算法由于在迭代过程中加入了对隶属度奖惩的判定过程,执行时间明显加长;FRFCM算法由于在灰度直方图上实现聚类,同样可以得到较短的执行时间;本文提出的DSFCM-RI算法虽然结合区域信息指导抑制因子的自适应选取,但是初始区域划分需要一定耗时,故执行时间较长。综上所述,本文算法虽然运行效率较低,但具有较高的收敛性能,同时分割性能与聚类性能也较对比算法具有一定的改善。

4 结束语

本文提出一种结合区域信息的双抑制模糊C-均值聚类图像分割算法,本文算法针对SFCM算法及其改进算法大多仅考虑图像像素的灰度信息,分割准确率较低,算法收敛较慢等不足,通过提取并利用图像的区域信息实现对隶属度的一次抑制,有效克服像素错分问题,达到提高分割准确率的目的。此外,本文将区域信息和数据分布特性相结合,采用指数函数设计抑制因子的选取公式,实现抑制因子的自适应确定,由于该公式可以不涉及任何参数的实现对隶属度的二次抑制,因此对提升聚类性能起到了积极的作用。与此同时,引入区域信息也起到了加速收敛的目的。通过仿真实验及定量分析可知,相较对比算法,本文算法有效降低了分割时的误判,同时提高了算法的聚类性能,亦对收敛性能具有一定的积极影响。但是,二值化阈值T仍然采用主观经验值方式进行选取,算法目前仅仅面向二分类问题。如何使阈值参数自适应和将算法推广至多类问题将是下一步的研究课题。此外,初始区域划分的可靠性会在一定程度上影响对算法性能,如何快速有效进行初始区域划分是利用区域信息进行聚类的过程中值得进一步研究的课题。

猜你喜欢
灰度阈值聚类
采用改进导重法的拓扑结构灰度单元过滤技术
土石坝坝体失稳破坏降水阈值的确定方法
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
Arduino小车巡线程序的灰度阈值优化方案
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
基于迟滞比较器的双阈值稳压供电控制电路