基于多尺度方向分解的纹理特征提取方法研究

2021-01-06 19:41郭恒光朱默赵亮
计算技术与自动化 2021年4期

郭恒光 朱默 赵亮

摘 要:为了有效提取图像的纹理特征,充分利用纹理的方向性以及纹理在不同方向具有不同頻率成分这两个特性,提出了基于多尺度方向分解的纹理特征提取方法。首先根据Radon变换的方法检测纹理方向,Radon变换各角度投影向量方差的二阶导数最小值对应的投影角度即为纹理方向。然后根据得到的图像纹理方向信息,利用可控金字塔将图像沿纹理方向进行三个尺度的分解,得到纹理方向上图像的多尺度子带图像。最后以三个尺度子带图像的Legendre矩和Zernike矩作为图像的纹理特征。分别在Brodatz和VisTex数据集上进行实验验证,与其他方法的对比结果表明,采用多尺度分解的方法提取纹理,用于纹理图像识别时,识别准确率高,抗噪声能力强。

关键词:方向分解; 可控金字塔变换;纹理特征

中图分类号:TP391      文献标识码:A

Abstract:In order to extract the texture feature of the image effectively, the texture feature extraction method based on multiscale orientation decomposition was proposed, which can make full use of the texture orientation and the property that the texture has different frequency component at different orientation. Firstly, the texture orientation was detected by the Radon transform, the projection angle corresponding to the minimum second derivative value of the projection vector variance of the Radon transform at different angle is the orientation of the texture. Secondly, according to the texture orientation information of image, the steerable pyramid transform was used to decompose the image multiscale along the texture orientation, and the multiscale subband of the image can be obtained at the texture orientation. At last, the Legendre moment and the Zernike moment of each scale subband image were used as the texture feature of the image. The proposed method was verified in the Brodatz and VisTex datasets. Compared with other methods, the results show that the proposed method can reach the higher correct classification rate, and has stronger anti-noise ability.

Key words:orientation decomposition; steerable pyramid transform; texture feature extraction

纹理是图像的一个非常重要的特征,在图像识别[1-4]、图像检索[5-8]以及图像匹配[9-12]等领域起着重要的作用。对图像纹理进行特征描述就是研究纹理的特点,描述纹理的本质特征,进而实现根据纹理特征对图像进行识别等目的。纹理是有方向性的,纹理的方向性是表达纹理的一种重要特征[13-14],而且沿不同方向纹理所包含的频率成分是不同的[15]。文献[16]的方法是在采用Radon变换检测纹理方向的基础上,将图像根据纹理方向进行旋转,然后对旋转后的图像进行小波变换,最后以各子带图像的能量和不一致性作为纹理特征;文献[17]的方法是对纹理图像进行多尺度和多方向的Gabor变换,以Gabor变换后图像能量的均值和标准差作为纹理特征;文献[18]的方法对纹理图像进行多尺度和多方向的Gabor wavelet变换,以变换后图像的能量的均值和标准差作为纹理特征向量。在此基础上本文利用可控金字塔变换[19],提出了基于多尺度方向分解的纹理特征提取方法。

可控金字塔变换是由Simoncelli和Freeman在方向可控滤波器理论[20]的基础上提出的一种图像的线性多分辨率分析方法,可以将图像分解为不同尺度和不同方向。与传统的金字塔分解和小波分解相比较,可控金字塔变换将图像的尺度信息和局部信息相结合,不仅保留了紧致集正交小波的特点,而且子带方向具有可调节性。通过对特征空间进行一些操纵,可以实现旋转不变性,这些性质是大部分小波变换所不具备的。

本文方法对图像进行多尺度方向分解时,首先确定图像纹理方向,然后根据得到的图像纹理方向信息,利用可控金字塔将图像沿纹理方向进行多尺度分解,得到图像在纹理方向上的多尺度子带图像。计算各尺度子带图像的Legendre矩和Zernike矩,以矩特征作为图像的纹理特征。

1 可控金字塔变换

1.1 可控滤波器

由图1可以看出,可控金字塔分解首先通过高通滤波器H0和低通滤波器L0将图像分解为高通子带和低通子带,采用k个方向带通滤波器B0,B1,…,Bk-1和一个窄带低通滤波器L1将低通子带分解为k个方向的带通子带和一个低通子带,然后对低通子带进行下采用操作,下一级分解通过对下采样后的低通子带应用B0,B1,…,Bk-1和L1进行递归分解。

2 图像多尺度方向分解

本文对图像进行多尺度方向分解时,首先根据Radon变换的方法确定图像纹理方向,然后根据得到的图像方向信息,利用方向可控滤波器组将图像沿纹理方向进行多尺度分解,得到纹理方向上多个尺度的子带图像。

2.1 纹理方向检测

本文根据Radon变换的方法检测纹理方向[21],首先在若干角度对图像进行Radon变换,然后计算Radon变换各投影角度投影向量的方差,最后根据各角度投影向量方差的二阶导数确定纹理方向,二阶导数最小值对应的投影角度即为纹理方向。

如图2(b)所示,检测出的图2(a)所示纹理图像的纹理方向为91度,与图像纹理的实际方向比较相符。

4 实验结果与分析

4.1 实验设计

为了有效评价所提出的纹理特征提取算法的有效性,将本算法与其他文献的方法进行比较,选取的纹理图像集为在文献[25]中所使用的两种纹理数据集。

第一个数据集是根据Brodatz纹理集中所有的112种纹理图像得到的,将Brodatz纹理集中各纹理图像以10°为间隔,旋转10°到360°,从旋转后的纹理图像的中心提取大小为256×256的子图像作为第一个数据集的样本,则第一个数据集共包含112×36=4032幅纹理图像,称之为Brodatz数据集。部分Brodatz数据集纹理图像如图6(a)所示。

第二个数据集根据VisTex纹理集中的54种纹理图像得到的,每幅纹理图像大小为512×512,将每幅图像分为四个不相重叠的,大小为256×256的子图像,以10°为间隔,旋转10°到160°,然后从旋转后的子图像中提取大小为128×128的子图像,共得到54×4×16=3456幅图像,称之为VisTex数据集。部分VisTex数据集纹理图像如图6(b)所示。

本文实验中,参与比较的纹理特征提取方法包括:文献[16]的方法,文献[17]的方法和文献[18]的方法。

4.2 实验过程

为了综合评价各纹理特征提取算法的性能,本文中进行两组实验,实验一是在原始数据集上进行的,实验二是在添加高斯白噪声的数据集上进行的。在实验二中,为了评价各纹理特征提取算法的抗噪声干扰能力,在Brodatz数据集和VisTex数据集的每幅纹理图片上添加均值为0,信噪比(SNR)由20变化到10的高斯白噪声。为了便于对各种方法进行比较,采用各种纹理特征提取方法进行纹理识别时,分类器采用k近邻法,用留一法交叉验证各纹理特征提取方法的性能,以识别准确率作为评价指标。

4.3 实验结果与分析

实验一的结果如表1所示。由表1所示的实验一的实验结果可以看出,本文的方法在两个数据集上的识别准确率要明显高于其他三种方法,文献[17]的方法由于只采用Gabor变换后图像能量的均值和方差作为纹理特征,没有考虑图像旋转的问题,因此识别准确率较低,文献[16]的方法和文献[18]的方法所提取的特征由于都具有旋转不变性,因此识别率均比文献[17]的方法要高。

图7为实验二的实验结果,图7(a)和(b)分别是在Brodatz数据集和VisTex数据集上的实验结果。由图7(a)和(b)的对比可以看出,随噪声水平的增加,各算法识别准确率在Brodatz数据集和VisTex数据集上的变化趋势大致相同,文獻[17]的方法抗噪能力最差,随着噪声水平的增加,在两个数据集上识别准确率变化都比较大;文献[16]的方法、文献[18]的方法和本文的方法在两个数据集上随着噪声水平的增加,识别准确率的变化都比较小,本文的方法抗噪能力稍微优于文献[16]的方法和文献[18]的方法。

由以上两个实验看出,提出的基于多尺度方向分解的纹理特征提取方法不仅识别准确率高,而且抗噪声能力也强。

5 结 论

针对图像纹理特征提取的问题,提出了基于多尺度方向分解的纹理特征提取方法,能够充分利用纹理的方向性以及纹理在不同方向具有不同频率成分这两个特性。在确定图像纹理方向的基础上,利用可控金字塔变换将图像沿纹理方向进行多尺度分解,可控金字塔变换结合了图像的尺度信息和局部信息,而且具有旋转不变性。最后,以各尺度子带图像的Legendre矩和Zernike矩作为图像的纹理特征。在Brodatz数据集和VisTex数据集上的实现表明,本方法不仅识别准确率高,而且抗噪声能力也强。

参考文献

[1]王雷宏, 陈永生, 郑玉红. 基于叶片数字纹理特征自动识别胡颓子属植物[J]. 中国农学通报,2020,36(11):20-25.

[2]陈雪鑫, 孙玥, 苗圃,等. 基于多级纹理特征的深度信念网络人脸识别算法[J]. 计算机应用与软件,2020,37(4):156-163.

[3]李巨虎, 范睿先 ,陈志泊. 基于颜色和纹理特征的森林火灾图像识别[J]. 华南理工大学学报(自然科学版),2020,48(1):70-83.

[4]黄兴华, 叶军一, 熊杰. 基于纹理特征融合的道路垃圾图像识别及提取[J]. 计算机工程与设计,2019,40(11):3212-3218.

[5]秦智康, 张衡阳. 基于变换域中的自适应纹理图像检索[J]. 液晶与显示,2020,35(3):281-286.

[6]彭金喜, 苏远歧, 薛笑荣. 基于深度学习和同生矩阵的SAR图像纹理特征检索方法[J]. 计算机科学,2019,46(S1):196-199.

[7]兰蓉, 郭思忱, 贾世英. 基于纹理与形状特征融合的刑侦图像检索算法[J]. 计算机工程与设计,2018,39(4):1106-1110.

[8]兰蓉, 马威. 基于改进纹理特征的现堪图像检索算法[J]. 西安邮电大学学报,2019,24(4):36-42.

[9]程诗梦, 周之平, 李忠民. 结合多维定标和局部纹理特征的改进SIFT匹配算法[J]. 计算机工程与设计,2017,38(11):3087-3092.

[10]朱庆, 陈崇泰, 胡翰,等. 顾及纹理特征的航空影像自适应密集匹配方法[J]. 测绘学报,2017,46(1):62-72.

[11]陈宁, 杨永全. 基于纹理特征匹配的快速目标分割方法[J]. 电子设计工程,2017,25(23):39-42.

[12]郭令, 赵博, 刁海南. 一种改进的指纹纹理匹配算法[J]. 计算机工程与应用,2006,42(32):180-182.

[13]余道喜. 纹理方向检测的光学实现方法研究[D]. 重庆: 重庆大学, 2016.

[14]王震, 王执铨, 茅耀斌. 基于纹理方向的描述和对具有方向性图象的分类与分割[J]. 中国图象图形学报,2002,7(12):1279-1283.

[15]PAN W M, BUI T D, SUEN C Y. Rotation invariant texture classification by ridgelet transform and frequency-orientation space decomposition[J]. Signal Processing, 2008,88(1):189-199.

[16]JAFARI K, SOLTANIAN Z H. Radon transform orientation estimation for rotation invariant texture analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(6):1004-1008.

[17]BIANCONI F, FERNANDEZ A. Evaluation of the effects of Gabor filter parameters on texture classification[J]. Pattern Recognition, 2007,40(12):3325-3335.

[18]ARIVAZHAGAN S L. GANESAN S P. Texture classification using Gabor wavelets based rotation invariant features[J]. Pattern Recognition Letters, 2006,27(16):1976-1982.

[19]SIMONCELLI E P, FREEMAN W T. The steerable pyramid: a  flexible architecture for multi-scale derivative computation[C]// Proceedings of 1995 International Conference on Image Processing,1995:444-447.

[20]FREEMAN W T, SIMONCELLI E P, ADELSON E.H. The design and use of steerable filters[J]. IEEE Transactions on Pattern Recognition and Machine Intelligence,1991,13(9):891-906.

[21]JAFARI K K, SOLTANIAN Z H. Radon transform orientation estimation for rotation invariant texture analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005,27(6):1004-1008.

[22]HU M K. Visual pattern recognition by moment invariants[J]. IEEE Transactions Information Theory,1962,8(1):179-187.

[23]TEAGUE M. Image analysis via the general theory of moments[J]. Journal of Optimal Society of America,1980,70(8):920-930.

[24]張辉.矩的快速算法研究和不变量构造及应用[D]. 南京:东南大学,2006.

[25]WANG X, GUO F X, XIAO B, et al. Rotation invariant analysis and orientation estimation method for texture classification based on radon transform and correlation analysis[J]. Journal of Visual Communication and Image Representation,2010,21(1):29-32.