基于Matlab的尿沉渣图像有形成分的自动分类方法

2015-05-10 01:16刘肖肖王兢业
中国医疗设备 2015年2期
关键词:管型尿沉渣特征值

刘肖肖,王兢业

湖北文理学院附属医院(襄阳市中心医院),湖北 襄阳 441021

基于Matlab的尿沉渣图像有形成分的自动分类方法

刘肖肖,王兢业

湖北文理学院附属医院(襄阳市中心医院),湖北 襄阳 441021

0 前言

尿沉渣是尿液经过离心或自然沉淀之后形成的沉渣,是尿液中各有形成分的集合,包括红细胞、白细胞、上皮细胞、管型、结晶和杂质等成分。尿沉渣检查能辅助临床对泌尿系统疾病进行诊断,但其成分众多,不易区分[1]。临床上常用的尿液检查方法有干化学法、流式法和镜检法等[2]。干化学法应用试纸条进行检测,成本低,但只能测试尿液中的某些化学成分,无法分析尿沉渣形态,从而影响对病变部位的判断,其试纸条也容易受到药物影响;流式法的检测结果较准确,医院使用率也很高,但其设备价格较高。目前,国内普遍使用的方法是分别应用干化学法和流式法进行尿检,当二者结果偏差大时,则使用人工镜检法,即将标本放置在显微镜下直接观测。

Matlab是一款商业数学软件,功能强大、函数库丰富、简单易学,在矩阵运算和图像处理领域有着广泛而有效的应用。为了解放人力并减少检验成本,本研究基于Matlab环境,尝试应用自动镜检法,即首先应用显微镜采集尿沉渣图像,再利用计算机对该图像进行自动处理,从而得到尿沉渣中有形成分的种类和数目。

本研究的图像处理分为预处理和特征提取两部分:首先去除图像的杂质和噪声,提取出图像中有形成分的边缘信息,并将图像分割成适合分类识别的小图像;然后提取出每个小图像的特征值,并利用该特征值对有形成分进行识别和分类。图像处理的流程图,见图1。

图1 图像处理流程图

1 尿沉渣图像的预处理

尿沉渣成分复杂,结构多样,图像在采集过程中可能出现光照不均、散焦严重,有些成分边缘较淡不易识别、背景上有杂质和阴影等情况。为了方便后续处理,本研究首先将图像灰度化以去除彩色图像中的冗余信息,然后使用全局直方图均衡化来加强有形成分和背景的对比度,之后利用邻域滤波法去除刻度框的投影,最后应用中值滤波法去除椒盐噪声。

2 边缘检测算法

若要对尿沉渣图像中的有形成分进行分类,便要先获得每个有形成分的特征值;若要获得特征值,便要将每个有形成分的边缘信息提取出来,方法如下。

(1)首先提取边缘信息。经过实验发现,Canny算子可以提取出纤细的边缘信息,但是对于边缘清晰度不同的成分会发生断续,从而出现边缘提取不完整的现象[3-4];而Sobel算子提取的边缘信息较多,但提取的是双边缘信息,过于冗杂,且也有断续现象,从而导致在提取连通域信息时丢失边缘信息。通过两种算法处理的上皮细胞细节图,见图2。

图2 Canny算子和Sobel算子处理的上皮细胞细节图

图2中,(a)为原尿沉渣图像中的上皮细胞图;(b)是对原尿沉渣图像作Canny边缘检测后所得图像中该上皮细胞的处理结果,有断续现象;(c)是对原尿沉渣图像作Sobel边缘检测后所得图像中该上皮细胞的处理结果,有边缘信息冗余;(d)是对Canny算子处理的上皮细胞作连通域填充的结果,连通域与原图中的上皮细胞形态相差甚远。对Sobel算子处理的上皮细胞作连通域填充后,依然存在细胞信息丢失的情况,此处不表。此外,由于所用显微镜倍数较低,导致采集图像的分辨率不够高,当观察单个细胞时,图像清晰度偏低,但不影响最终处理结果。

而将经Canny算子和Sobel算子滤波之后的两幅图像进行叠加及平均处理,再进行膨胀腐蚀、孔洞填充等一系列处理后,可得到良好的连通域(图3)。

图3 叠加算子处理的上皮细胞细节图

图3中,(a)为对图2(a)分别进行Canny与Sobel边缘检测后进行叠加及平均处理后的图像;(b)为对叠加图像进行连通域填充等一系列处理后的结果,与原图的形态信息接近,处理结果良好。

(2)最终的处理步骤为:灰度化图像,去除冗余信息;直方图增强,增大有形成分和背景的对比度;邻域滤波,去除刻度框阴影;中值滤波,去除椒盐噪声;Canny和Sobel算子叠加进行边缘检测,得到完整的边界信息;膨胀腐蚀和孔洞填充后得到连通域。白细胞、上皮细胞和管型的最终处理结果对比,见图4。由图4可知,各成分的刻度框阴影已完全消除,且不影响有形成分的边缘提取;白细胞的右上角粘连现象的处理仍需改进,但定位定型检测基本准确;上皮细胞的灰度虽较低,但边缘定位良好;管型内虽含大量细胞颗粒,较为零散,但处理效果良好。对大量处理后的图像进行观察验证的结果表明本研究提出的预处理方法对本组图像通用,处理效果显著。

图4 边缘信息提取处理结果对比

3 有形成分的特征提取

经过上述处理,已经得到完整的连通域信息,对每个连通域进行处理,便可以得到其特征值。

3.1 有形成分特征

尿沉渣中的有形成分多种多样,主要包括红细胞、白细胞、管型、结晶、上皮细胞和杂质等。本文重点对正常成分进行分类,异常成分暂不处理。正常红细胞呈双面凹陷圆盘状,淡黄色,较小,尿中出现红细胞表示肾脏出现病变;正常白细胞呈圆球状,形态规整,细胞膜及细胞核清晰可见,比红细胞略大;结晶种类繁多,意义大多不明[5];上皮细胞包括肾小管上皮细胞、移形上皮细胞、鳞状上皮细胞和多核巨细胞等,除了肾小管上皮细胞形状规则外,其他上皮细胞形状皆不规则;管型包括透明管型、颗粒管型、细胞管型、变形管型和宽幅管型等,多为矩形柱状。

3.2 特征选择和提取

根据有形成分特征,本研究除了使用周长、面积、长宽比、矩形度等常用特征值外,另外选用圆形度和Hu 7个不变矩共12个特征值对不同的有形成分进行识别区分。圆形度的计算公式为:,它表征了连通域似圆的程度,以此来有效区别圆细胞和非圆成分,比如白细胞和管型。Hu 7个不变矩由二阶和三阶归一化中心矩构造,具有旋转、平移和缩放的不变性。在尿沉渣图像中,由于细胞的形态多样,对于同一类细胞例如管型,当细胞在图像中的位置发生改变但细胞本身的形态并未改变时,Hu 7个不变矩可以将图像中处于不同位置的同一细胞归为一类。

4 使用BP神经网络对各有形成分分类

4.1 BP神经网络

人工神经网络(ANN)是一种在模拟生物神经网络的基础上创建的一种有关信息处理的系统,是一种经典的非数值算法,具有强大的信息存贮和计算能力[6],在联想记忆、模式识别、复杂控制、函数逼近、信号处理与图像处理等领域应用广泛[7]。现在已有的ANN模型有Hopfield网络、对向传播网络、误差反向传播网络、Kohonen网络、自组织映射模型、径向基函数网络等,其中以BP(Back Propagation)神经网络模型的应用最为广泛[7-8]。

本研究尝试使用BP神经网络对尿沉渣有形成分进行分类。BP神经网络,包括信息的正向传播和误差的反向传播。其输入层负责接收数据并将其传递给隐含层各神经元,隐含层对数据进行一级或多级处理后由最后一级隐含层将处理结果传递给输出层,最后数据经输出层处理后输出,便完成了一次正向传播处理。当输出数据与期望输出相差甚远时则进入误差反传阶段,通过输出层将误差按一定的规则反向修正,周而复始直至输出数据与期望输出相同或达到预设的学习次数为止。

BP神经网络结构图,见图5。

图5 BP神经网络结构图

如图所示,BP神经网络最少由3层网络组成,第一层为输入层,最后一层为输出层,中间层为隐含层,隐含层可以有多层。每层都包含任意数量的神经元,神经元之间无联系,但层与层之间互联。BP神经网络的复杂性随神经元与层数的增加而增加,训练时间也相应增加。

4.2 BP神经网络在Matlab环境中的应用

本研究基于Matlab环境对尿沉渣图像进行分析和处理,使用BP神经网络对各有形成分的特征向量进行学习和分类。

在使用BP神经网络对尿沉渣有形成分进行分类的过程中,需要设定每一层神经元的数量。经过反复试验发现,设置1个输入层、1个输出层和两个中间层时,有形分类的效果最贴近实际。由于共挑选了12个特征值作为输入,所以输入层选用12个神经元;最后要分类出6种成分,所以输出层选用1个神经元,而此神经元有6个不同的值,此处赋为1~6;经过多次试验比对,中间层即隐含层分别选用24个和10个神经元。

Matlab神经网络工具箱封装了很多神经网络函数,本研究仅描述BP神经网络相关函数的使用规则和流程,描述如下。

(1) 创建1个BP网络net,有1个输入层(有12个神经元)和1个输出层(有1个神经元),两个中间层(分别有24个和10个神经元)。

net=newff(P,[12,24,10,1],{ 'tansig' 'purelin'});

newff表示创建1个网络为BP网络,P用来定义输入向量的最大值和最小值,因为处理输入数据时会做归一化处理,所以此处最大值为1,最小值为-1;之后是网络层的设置,分别为12、24、10和1;最后是第i层的传递函数,第二层采用正切函数式,其余全选择默认S型对数式。newff函数其他参数也全部采用默认值。

(2)初始化网络。

net=init(net);

(3)采用梯度下降法训练网络,最大训练次数为10000,误差为0.0001,每训练10次显示1次。

net.trainparam.epochs=10000;

net.trainparam.show=10;

net.trainparam.goal=1e-4;

(4)开始训练并将网络保存成Uri.mat。

[net,tr,Y,E]=train(net,P,T);

P为输入向量,T为每个有形对应的输出值。

save('Uri','net');

(5)使用新样本P1进行预测。

YY =sim(net,P1);

YY即为预测结果。

4.3 有形成分分类结果

将未分类的有形成分样本特征值输入到训练好的网络中进行分类处理,结果见表1。

表1 未知样本有形成分识别率

经分析发现,在实际处理中,有些红细胞会被误检成白细胞,而一些粘连的白细胞会被误检为上皮细胞,有些透明的上皮细胞则会造成边缘误判,被分割成数个小连通域。结晶的种类较多,检测结果不准确。管型细胞特征较明显,检测结果尚可。该结果说明,使用BP神经网络对尿沉渣进行分类的方法是可行的,后续工作需要提高其检测准确率。

5 总结和展望

经过研究表明,本研究使用12个特征值经BP神经网络对尿沉渣图像中的有形成分进行分类和计数的效果较好,且处理速度较快。Matlab封装的BP神经网络的函数易于理解和使用,但是网络层数的确定是个复杂而细致的工程,需要不断的摸索和尝试。

但本研究也有一定的局限性:对于不同质量的图像,该分类方法的效果未知,本研究使用的图像分辨率偏低,细节比较模糊,日后应增拍清晰图像进行验证;当检验需求更加细致如需分析上皮细胞的类型时,就要重新设计分类方法;对有形成分的类别判断需依靠大量的临床知识和经验,尚需进行进一步改进以向临床推广。

[1] 王冠.尿沉渣检查的临床价值分析研究[J].中外医学研究, 2012,20(25):48.

[2] 刘兴莉.常用的三种尿沉渣检测方法的比较[J].齐鲁医学检验, 2004,15(6):45.

[3] 彭淑敏.神经网络图像识别技术研究与实现[D].西安:西安电子科技大学,2005.

[4] John Canny.A computational approach to edge detection[J].IEEE Transactions on PAMI,1986,8(6):679-698.

[5] 刘肖肖.尿沉渣图像采集与分析系统的研究[D].济南:山东大学,2014.

[6] 马莉,杜一鸣,黄光,等.基于样本熵与人工神经网络的癫痫发作预测初步研究[J].中国生物医学工程学报,2013,32(2):243-247.

[7] 焦振.误差反向传播神经网络(BP网络)算法的启发式改进[J].安阳师范学报,2008,(5):47-49.

[8] 胡金滨,唐旭清.人工神经网络的BP算法及其应用[J].信息技术, 2004,28(4):1-4.

Matlab-Based Automatic Classification Method of Tangible Components in Urinary Sediment Images

LIU Xiao-xiao, WANG Jing-ye
Affiliated Hospital of Hubei College of Arts and Sciences (Xiangyang Central Hospital), Xiangyang Hubei 441021, China

目的 依托于Matlab环境,初步实现BP(Back Propagation)神经网络对尿沉渣图像中有形成分的自动识别与分类。方法 首先应用灰度化、直方图增强、邻域滤波和中值滤波等方法对图像进行预处理;再利用Canny算子和Sobel算子叠加处理进行边缘检测,通过膨胀腐蚀和孔洞填充等操作得到有形成分的连通域信息,提取出每个连通域的周长、面积、长宽比、矩形度、圆形度等12个特征值作为BP神经网络的输入;最后利用BP神经网络创建学习训练过程,对每个连通域即有形成分进行分类。结果 采用该自动分类方法得到了尿沉渣图像中有形成分的种类和数目。结论 该方法分类准确,可实现尿沉渣图像中有形成分的自动识别与分类。

尿沉渣图像;边缘检测;特征提取;BP神经网络;Matlab

Objective To classify the tangible components in urinary sediment images automatically through application of BP (Back Propagation) neural network on basis of Matlab. Methods The urinary sediment images were preprocessed with the methods of graying, histogram enhancement, neighborhood filtering, median filtering and so on. Then, the Canny and Sobel operators were applied to perform edge detection. The information of connected domains for the tangible components were obtained through expansion corrosion and hole filling, from which 12 characteristic values including the perimeter, area, aspect ratio, rectangle and round degree were extracted as the input of BP neural network to classify the tangible components in urinary sediment images. Results The type and quantity of the tangible components in urinary sediment images were obtained with the application of this automatic classification method. Conclusion The automatic classification method made it possible to precisely identify and classify the tangible components in urinary sediment images.

urinary sediment images; edge detection; characteristics extraction; back propagation neural network; Matlab

TP183

A

10.3969/j.issn.1674-1633.2015.02.007

1674-1633(2015)02-0029-04

2014-08-14

2014-10-09

王兢业,副主任技师

作者邮箱:466593784@qq.com

猜你喜欢
管型尿沉渣特征值
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
一类带强制位势的p-Laplace特征值问题
尿常规与尿沉渣对尿液检验的影响及分析
布置型式对动力管道异常大位移影响计算
单圈图关联矩阵的特征值
装配式管型、箱型通道与现浇箱涵造价对比分析
用尿沉渣分析仪对混浊尿液标本进行尿沉渣检查的效果分析
迭代方法计算矩阵特征值
UF-1000i尿液沉渣分析仪在尿液管型检测中的应用分析
关于一种尿液中有形成分保存方法的讨论