基于多特征提取和SVM分类器的木材显微识别

2017-12-14 10:44吴啸天
陕西林业科技 2017年5期
关键词:元宝识别率木材

吴啸天

(西北农林科技大学林学院,陕西 杨凌 712100)

基于多特征提取和SVM分类器的木材显微识别

吴啸天

(西北农林科技大学林学院,陕西 杨凌 712100)

将多种不同木材的显微细胞图片进行识别,对进行木材分类研究具有重大意义。通过利用支持向量机(SVM),结合图像的图像梯度方向直方图(HOG)、局部二值模式(LBP)特征以及图像均值方差,对小规模的木材细胞图像的识别分类效果进行了实验。实验结果表明,SVM分类器结合多特征融合适的特征向量会有较好的识别效果,平均最高识别率达到了98.11%。

多特征提取; 支持向量机; 小规模数据; 识别分类; 木材显微细胞

木材作为一种天然的、重要的材料,被广泛地用在家具与家居、乐器、交通、艺术品、建筑等行业。不同树种的木材性能差异很大,而市场上木材商品种类繁多,很难分辨。传统的人工识别方法主要依靠人们的经验,即根据细胞有无导管,将其分为针叶材(无导管)和阔叶材(具有导管);然后根据细胞上轴向管胞、轴向薄壁组织、树脂道等特征再将木材进行具体分类,对于阔叶材还要结合其导管的特征等。这种方式较为感性,往往会出现误判和不能识别的现象[1]。

在图像分类方面,将图像的不同特征融合在一起,会产生更好的分类效果[2]。支持向量机作为一种有效的分类和统计学习方法,有着有着较为广泛地研究和利用[3]。唐银凤等人通过融合多特征纹理分类生成纹理查找表并结合SVM(support vector machine)分类器对光学纹理图像进行了分类[4],陈维华运用支持向量机(SVM)实现了对音乐的情感分类[5]。为实现利用木材显微图像及其特征对不同树种木材种类的识别,我们进行了探索,报告如下。

1 材料与方法

1.1 材料

本实验选用鹅耳枥(Carpinusturczaninowii)、银白杨(Populusalba)、元宝槭(Acertruncatum)、冷杉(Abiesfabri)、落叶松(Larixgmelinii)等5种我国北方常见树种,显微照片利用西北农林科技大学木材标本实验室切片拍照,图像放大40倍(图1-5);每种木材50幅图像,其中每种选取40幅作训练样本,10幅作测试样本,每个样本像素256×256。

图1 供试树种木材纤维显微照片

1.2 方法

不同树种木材纤维的细胞上轴向管胞、轴向薄壁组织、树脂道等显微特征不同,据此利用其显微照片和图像特征分析技术进行不同树种木材纤维区分。

1.2.1 图像特征指标

(1)HOG指标

方向梯度直方图(HOG)最初由Dalal等[6]人提出,反映了图像不同点位之间像素的梯度,将整个图像细分为多个小的细胞单元(cell)进行特征提取[7],不从图像的整体考察特征,而是因此,HOG得到的描述子对图像的光学和几何形变都保持了很好的不变性。

在HOG特征提取时,首先将图像经行灰度化,然后对输入图像进行颜色,计算每个像素的梯度,将图像划分为小的胞元(cell),计算每个cell的梯度直方图,然后将每几个cell组成一个块,串联所有块内特征即为整幅图像的特征向量。

本实验所采用的HOG参数有归一化图像大小为256×256像素,胞元大小为32×32像素,块大小为64×64像素,采用Sobel算子得到梯度,每个像素点的梯度在0°~360°内分为18级,最终得到的特征维数为3528维。

(2)LBP指标

基本LBP算子是定义在一定区域内,中心像素值和其它像素值进行比较,结果标记为1或0,这样就能表征该邻域的LBP值。Ojala等人[10]对该算法进行了改进,即令 LBP算子的半径和像素点个数可以为任意的;LBP特征具有灰度不变性和旋转不变性等显著优点[8],并且其计算简单、效果较好,且能结合图像的整体特征。

基本LBP算子定义如式(1)所示:

LBPN,R=∑N-1i=0s(gi-gc)2i,s(x)

={1,x≥0,0,xlt;0}

(1)

其中gi表示第i个像素的灰度值,gc表示中心像素的灰度值,N为采样点数,R为区域半径。

本实验中LBP算子运算步骤是将归一化的256×256像素的图像进行分块,每个块大小为32×32像素,在每个块内再将局部区域进行阈值化处理得到一个8位二进制数,将每一位数与对应的权重相乘然后进行求和,将结果进行归一化处理,即可得到该区域的LBP值,将一个块内局部区域的LBP值串联起来即可得到该块的LBP值,最后所有块的LBP值串联起来就可以得到整幅图像的特征向量。

(3)图像均值和方差

图像对比度是指图像的明亮差异程度,其本质是不同像素点之间的差值;方差表征图像的对比度,均值表征图像的整体亮度。本实验为了排除图像自身对比度和亮度的影响,在提取的特征向量中均附加了图像的均值方差。

1.2.2 图像整体特征区分 采用支持向量机(SVM)方法表征,SVM是由Cortes和Vapnik提出[11],在解决小样本、非线性及高维数方面有很大的优势。SVM求取最优分类面的优化函数定义如下:

(2)

式中,x为样本,n为样本的个数,y是类别编号,λi(i=1,2,…,n)是函数优化时的language系数,相应的判别函数为:

(3)

式中b*是分类的阈值。对于非线性判别问题,可做适当的变换,即将式(2)的优化函数变为:

(4)

(5)

内积(Kxi·xj)被称为核函数。本实验使用的是径向核函数(radial basis function,RBF)[12]:

(6)

SVM算法有很多改进的版本。

采用林智仁(Lin Chih-Jen)等人研发的LIBSVM软件进行支持向量机(SVM)计算。

1.3 运算环境

实验的环境是Visual Studio 2013语言编程环境,使用计算机处理器是Inter(R) Core(TM) i5-4200M CPU G410,处理速度为2.50GHz,内存为4G。

2 结果与分析

2.1 LBP特征对木材树种的识别

利用LBP特征对供试树种木材显微的识别率分别为鹅耳栎81.81%、元宝槭54.55%、银白杨90.0%、落叶松90.0%、冷杉100%,其中元宝槭的识别率最低,冷杉的识别率最高,其原因可能是部分元宝槭细胞导管的排列方式与银白杨相似,提取的图像特征和银白杨接近所致;而其它四种识别率均在80%以上,并且冷杉全部识别出来,这意味着冷杉显微图像的纹理特征明显。

2.2 HOG特征对木材树种的识别

利用HOG特征对供试树种木材显微的识别率分别为鹅耳栎100%、元宝槭81.82%、银白杨100%、落叶松100%、冷杉100%,元宝槭识别率最低。和LBP特征相比,利用HOG特征进行识别的效果有了明显的提高。这说明这几种木材显微图像的边缘和梯度特征很强,另外由于HOG特征表征了图像局部形状变化,在一定程度上消除了因图像的平移和旋转带来的误差影响。

2.3 LBP+HOG特征对木材树种的识别

利用LBP+HOG特征对供试5个树种木材显微的识别率除元宝槭为90.91%外,其余都是100%;元宝槭的识别率尽管未达到100%,单分别高于LBP特征识别率和HOG特征识别率,说明对于每种木材而言,LBP+HOG特征识别效果要比单一特征好;由于两种特征所携带的信息量互不相同,因而将二者串联起来可以起到互补的作用,从而提高了每种木材图像的识别率。尽管利用混合特征的训练时间要比单一特征长,但这并不影响实际使用,因为模型只需要训练一次即可。

表1 不同特征类别的整体识别率和训练时间

3 结论与讨论

本研究利用LBP特征对木材树种的识别率平均为83.02%,HOG对木材树种的识别率平均为96.23%,HOG+LBP特征对木材树种的识别率平均为98.11%,将LBP特征和HOG特征融合在一起作为特征向量的效果最佳。本文利用数字图像处理技术,提出了一种识别木材显微图像的方法,通过提取样本图像的一些特征如LBP特征[14],HOG特征以及均值方差等,结合SVM支持向量机分类器[15],达到了较好的识别效果。

图2 不同树种识别率

[1] 汪杭军. 基于纹理的木材图像识别方法研究[D].合肥:中国科学技术大学,2013.

[2] 张斌,高鑫. 一种基于Gabor滤波器组和LBP的多特征联合SAR纹理图像分类方法[J]. 科学技术与工程,2010,10(17):4196-4201.

[3] 纪凯,韩栋. SVM支持向量机在遥感图像中的应用研究[J]. 湖南城市学院学报(自然科学版),2016,25(3):114-116.

[4] 唐银凤,黄志明,黄荣娟,等.基于多特征提取和SVM分类器的纹理图像分类[J]. 计算机应用与软件,2011,28(6):22-25,46.

[5] 陈维华. 基于支持向量机(SVM)的音乐情感分类[J]. 软件工程,2016,19(12):20-23.

[6] Dalal N, Triggs B. Histograms of oriented gradients for human detection[C]// Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. IEEE, 2005:886-893.

[7] 姚远,姜志国,张浩鹏. 基于层次化分类器的遥感图像飞机目标检测[J]. 航天返回与遥感,2014,35(5):88-94.

[8] 李嘉頔,陈振学,刘成云. 分块CS-LBP和加权PCA的低分辨率人脸识别[J]. 光电子·激光,2016,27(2):210-216.

[9] Ahonen T, Hadid A, Pietikinen M. Face Recognition with Local Binary Patterns[M]. IEEE Computer Society, 2006.

[11] L(x, λ). A Short SVM (Support Vector Machine) Tutorial. - JP Lewis[J]. 2015.

[12] 刘海伟. 图像分类与变化检测方法的研究与实现[D]. 北京:北方工业大学, 2013.

[13] 罗成石. 基于LIBSVM的粮食水分数据融合研究[J]. 科学技术与工程,2012,12(2):292-295.

[14] 多化豫,孙枭雄,袁云梅. 基于图像处理提高木材识别准确性的新方法[J].西北林学院学报,2017,32(1):244-247.

[15] 周熊,多化琼,王振柱,等. 基于图像处理和SVM探索木材与树皮的新识别参数[J].西北林学院学报,2014,29(5):199-202.

WoodMicroscopicRecognitionBasedonFeatureExtractionandSVMClassifiers

WU Xiao-tian

(CollegeofForestry,NorthwestAamp;FUniversity,Yangling,Shaanxi712100)

It is of great significance to study the microscopic cell images of many different woods. By using the support vector machine (SVM), the image gradient direction histogram (HOG), the local binary model (LBP) feature and the image mean variance were applied to the experiment with classification of small-scale wood cell images. The experimental results showed that the SVM classifier has a good recognition effect with the feature vector of multi-feature fusion, and the highest recognition rate at 98.11%.

Multi-feature extraction; SVM; small-scale data; identify and classification; wood cells

S781.1

A

1001-2117(2017)05-0011-04

2017-07-18

吴啸天(1995-),男,在校本科生。

猜你喜欢
元宝识别率木材
烤元宝火
橘子皮用来开发透明木材
数字说
木材在未来建筑设计中的应用分析
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
遛狗记
吃个蛋饺,捡个元宝
高速公路机电日常维护中车牌识别率分析系统的应用