基于直方图颜色特征的试纸识别新方法

2015-03-02 05:56曾德文梁光明刘任任丁建文
现代电子技术 2015年9期
关键词:主色调频度试纸

曾德文,梁光明,刘任任,丁建文

(1.湘潭大学信息工程学院,湖南湘潭411105;2.国防科学技术大学电子科学与工程学院,湖南长沙410075;3.爱威科技股份有限公司研发中心,湖南长沙410013)

基于直方图颜色特征的试纸识别新方法

曾德文1,梁光明2,刘任任1,丁建文3

(1.湘潭大学信息工程学院,湖南湘潭411105;2.国防科学技术大学电子科学与工程学院,湖南长沙410075;3.爱威科技股份有限公司研发中心,湖南长沙410013)

通过分析大量试纸垫图片的颜色信息,建立直方图模型,提取了试纸垫图像的主色平均色调、主色平均饱和度、平均亮度、频度最高饱和度四个特征,并建立BP网络识别模型,实现了试纸的浓度的鉴别。提出的试纸垫识别方法模拟了人眼识别过程,提高了试纸识别效率与结果的客观性。

试纸识别;颜色特征;主色平均色调;直方图模型;BP网络模型

0 引言

在医学领域,疾病的诊断常需要对多种参数进行衡量,这些参数数据大多来自样本的检测,尿液检测是一种比较常见并且有效的检测手段。尿液有形成分的检测方法包括尿沉渣检测[1⁃3],显微镜检测[4⁃5],尿液试纸检测[6⁃8]等。尽管现在计算机技术发展迅速,电子设备也不断地进入到医学领域,然而对于试纸检测结果的识别工作基本还是使用传统的人眼观察,与试纸垫标准样本比对来判断浓度。

图1是一张尿液检测试纸条图片,上面有11类试纸垫项目,使用传统方法识别时,拿图1中每一类试纸垫图片与标准图片比对,判断出试纸垫的浓度。

图1 试纸条图片

传统人眼比对的方法识别效率低,并且受工作人员主观因素影响大。近年来也出现了一些试纸自动识别仪器,它们通过改变照射光的波长,检测接收到的反射波强度来实现浓度识别[2],这类自动识别仪器识别效率高,但是对试纸垫的定位精度要求非常高并且受外界光线明暗程度等影响显著。

本文提出基于直方图颜色特征的试纸自动识别方法,根据试纸图片的像素信息提取颜色特征,并使用BP网络识别模型[9⁃10]完成试纸的识别。该方法由于采用基于图像的统计颜色特征,可以克服外界光照条件影响,提高识别效率。同时采用BP网络,具有学习功能。

1 试纸识别有效特征提取

基于图像颜色特征的试纸垫识别原理如图2所示,以尿液尿胆原项目为例,一共存在四个梯度浓度,浓度不同,试纸垫颜色不同,首先进行特征提取,得到主色调平均色调、主色平均饱和度、平均亮度、频度最高饱和度四维特征,然后送入尿胆原BP识别模型,实现浓度判别。

为了有效提取试纸的颜色特征,首先对输入图像进行了坐标变化,转变成HSI[11]图像,分析色调空间、饱和度空间、亮度空间统计规律,提取用于区别试纸浓度的特征。

图2 试纸垫图像识别原理图

1.1 试纸垫主色特征提取

色调直方图[12]表示图像的色调级与该色调概率间的统计关系。设输入图片的大小为M×N,H(m,n)是图像(m,n)处的色调值,F(h)是色调h的频度,0≤F(h)<1,其直方图公式表示为:

本文对多个项目多个浓度试纸垫的色调直方图进行了观察分析,图3中(a)和(b)分别是浓度为“+++”和“++”的胆红素试纸垫色调直方图,图3(c)和(d)是两张浓度都为“neg.”的维生素C试纸垫的色调直方图。

图3 色调直方图

色调能量是k个相邻色调对应频度的和,主色调能量是色调能量的最大值。通过图3可以看出(a)中主色调能量对应的色调值集中在10左右,(b)中主色调能量对应的色调值主要集中在355左右;(c)和(d)中主色调能量对应的色调值都集中在216左右。而主色调平均色调是主色调能量对应k个相邻色调值的平均值,因此选择它作为区分试纸垫浓度的主要特征之一。

定义:

为色调能量,k为用于计算色调能量的色调维数。若:

则试纸垫的主色调为:t,t+1,…,t+k-1。如果主色调t+j≥L(0≤j

设主色平均色调为MHavg:

1.2 试纸垫饱和度特征提取

饱和度直方图表示图像的饱和度级与该饱和度概率间的统计关系。设输入图片的大小为M×N,S(m,n)是图像(m,n)处的饱和度值,F(s)是饱和度s的频度,0≤F(s)≤1,其饱和度直方图公式为:

本文对多个项目多个浓度试纸垫的饱和度直方图进行了观察分析,图4(a)和(b)分别是浓度为“+++”和“++”的胆红素试纸垫饱和度直方图,图4(c)和(d)是两张浓度都为“neg.”的维生素C试纸垫的饱和度直方图。

图4 饱和度直方图示例

通过图4可以看出(a)中饱和度主要集中在51左右,频度最高饱和度在0.06左右;(b)中饱和度主要集中在25左右,频度最高饱和度在0.14左右;(c)和(d)的饱和度主要集中在75左右,频度最高饱和度在0.08左右。因此选择频度最高饱和度作为区别试纸垫浓度的特征之一。

成立,则定义smax为频度最高饱和度值。

设si为色调h第i次出现时与之对应的饱和度值,Hs为色调h对应的饱和度,则:

定义主色平均饱和度为MSavg:

1.3 基于亮度的特征提取

若输入图片的大小为M×N,m∈M,n∈N,I(m,n)=i(i=0,1,…,255),其中,i是图像I(m,n)处的亮度值,则平均亮度Iavg:

2 基于BP网络的试纸浓度识别

2.1 试纸垫识别模性建立

在提取特征基础上,本文采用输入为4个神经元、隐含层为9个神经元,输出根据测试项目输出决定的3层BP网络实现试纸垫浓度识别。其模型如图5所示。

图5 BP网络结构图

第一层网络输入特征矢量为X=(x1,x2,x3,x4)T,第二层(隐含层)的输出分别为Y=(y1,y2,y3,y4,y5,y6,y7,y8,y9)T,第三层(输出层)有k(代表输出浓度类型)个神经元,Z=(z1,z2,z3,…,zk)T。

神经元单元转换函数为S形函数(sigmoid函数):

式中X为输入状态。

隐含层各神经元输出关系可以表示为:

式中:wij是输入层xi对应于隐含层yi的权值的系数;θj为隐含层的第j个单元的域值。

输出层各神经元的输出关系为:

式中:wjk是隐含层yj对应于输出层zk的权值的系数;λk为输出层的第k个单元的域值。

2.2 尿液试纸垫输出类型

根据尿液分析项目标准,一般对胆红素、尿胆原、酮体、维生素C、葡萄糖、蛋白质、隐血、亚硝酸盐、pH值、尿比重、白细胞等1个项目作检测。各试纸垫与其对应的输出浓度如表1所示。

表1 试纸垫项目浓度表

3 实验数据及分析

3.1 试纸垫特征实验及分析

根据上述原理,本文对多个测试项目的多个浓度进行了特征提取和分析。

表2为胆红素不同浓度试纸垫的特征数据。表中数据都进行了归一化操作。

从表2中可以看出胆红素试纸垫的浓度越高,主色平均色调、主色平均饱和度和频度最高饱和度越大;而平均亮度则是试纸垫浓度越高,它的值就越小。

3.2 识别结果分析

BP网络识别模型采用指导训练机制实现,每个项目不同浓度采集了100个样本,训练收敛后得到每个项目的识别模型。随机抽取500个标本进行了测试,准确率达到了99%以上,其中5个标本识别误差由图像清晰度影响导致。

表2 胆红素试纸信息

4 结论

本文提出利用直方图计算尿液试纸垫图片的主色调、主色调能量、主色平均色调、主色平均饱和度、频度最高饱和度等颜色特征的方法,构造以主色平均色调、主色平均饱和度、平均亮度、频度最高饱和度为BP神经网络输入特征矢量的识别模型,实现了对尿液试纸图片浓度的识别,经过大量的实验证明该方法识别效率高、误判率低。

[1]刘波.尿液分析仪与尿沉渣显微镜检查比较分析[J].临床合理用药杂志,2013(35):96⁃97.

[2]王柏莲.UF⁃500i尿沉渣分析仪与显微镜检测尿液中有形成分的比较[J].医学信息,2011(7):3146⁃3147.

[3]刘媛,杨世霞,杜玫.浅谈全自动尿沉渣分析仪与显微镜在尿液分析中的应用[J].卫生职业教育,2012(14):157⁃159.

[4]宋继焱.尿液镜检法在尿常规检查中的重要性分析[J].中外医疗,2011(12):113⁃114.

[5]王肖雁.尿液镜检法在尿常规检查中的重要性[J].中国现代医生,2009(31):91⁃92.

[6]文庆成,马志荣,师本章.干化学分析在医学检验中的应用[J].辽宁医学杂志,1995(4):171⁃173.

[7]郭怀松,孙红娜.尿液分析仪与手工法检测结果的比较[J].亚太传统医药,2010(10):125⁃126.

[8]高莹.尿液检验中试纸法与镜检法的对比探讨[J].健康必读,2013(3):287⁃288.

[9]张海波,董槐林,龙飞.基于BP神经网络的图像识别研究[J].计算机与现代化,2008(5):17⁃19.

[10]万来毅,陈建勋,王卫平.基于BP神经网络的图像识别研究[J].武汉科技大学学报:自然科学版,2006(3):277⁃279.

[11]孙滔.基于颜色空间的图像特征提取的研究[D].长春:吉林大学,2006.

[12]强振平,刘辉.局部累积直方图在彩色图像检索中的应用[J].计算机与数字工程,2006(6):123⁃125.

A novel method of test strip recognition based on color features of histogram

ZENG De⁃wen1,LIANG Guang⁃ming2,LIU Ren⁃ren1,DING Jian⁃wen3
(1.College of Information Engineering,Xiangtan University,Xiangtan 411105,China;2.School of Electronic Science and Engineering,National University of Defense Technology,Changsha 410075,China;3.R&D Center,AVE Technology Co.,Ltd,Changsha 410013,China)

By analyzing the color information in a large number of test strip pad images,a histogram model was established first.Four features of average hue of dominant color,average saturation of dominant color,average brightness,highest frequen⁃cy saturation are then extracted from the strip pad images.The concentration identification of test strips is realized by using a BP network identification model.The proposed strip pad recognition method simulates the human eye identification process.The ex⁃periment results show it can improve efficiency and objectivity of strip pad recognition.

test strip recognition;color feature;average hue of dominant color;histogram model;BP network model

TN911.73⁃34;TP301.6

A

1004⁃373X(2015)09⁃0043⁃04

曾德文(1989—),男,湖南岳阳人,硕士,CCF会员。主要研究方向为图像处理。

梁光明(1970—),男,湖南涟源人,副教授,硕士生导师,博士,CCF会员。主要研究方向为图像处理、现代通信与信息安全。

2014⁃11⁃18

刘任任(1959—),男,湖南醴陵人,教授,博士生导师,博士,CCF理事。主要研究方向为多值逻辑理论、计算机算法设计与分析等。

丁建文(1957—),男,湖南岳阳人。主要研究方向为机器视觉、检测识别。

猜你喜欢
主色调频度试纸
绘颜绘色
红色,少先队活动永恒的主色调
血糖试纸保存方法及注意事项
血糖试纸不要放进冰箱
眨眼频度可判断烟瘾大小
铜绿假单胞菌MIC分布敏感百分数与抗菌药物使用频度相关性研究
热辣夏季
频度副词问与答