基于叶片图像特征数字化信息识别7 种柳属植物1)

2014-03-06 03:20杨天天潘晓星穆立蔷
东北林业大学学报 2014年12期
关键词:叶宽圆度包膜

杨天天 潘晓星 穆立蔷

(东北林业大学,哈尔滨,150040)

基于植物图像数字特征的物种识别是植物物种鉴定工作采用的新方法。虽然,植物的繁殖器官是植物识别的主要依据,但花期、果期存续时间短,植物样本不易获取,而叶片作为植物识别的重要性状之一,具有留存时间长,样本易获取等优点,虽然叶的形态变异显著,但其变异只在一定的范围之内[1]。基于植物叶片信息识别的研究已有很多,从最早的手工测量叶长、叶宽等[2-3],到运用图像分析软件来快速、精确地测量叶片的各项参数。计算机辅助植物分类与识别系统,最早是在2003年由祁亨年提出的,他是基于叶子特征的计算机辅助植物识别模型和叶缘锯齿特征来识别植物的[4-5],随后的研究都运用了计算机辅助技术,发展至今,已有基于叶片特征或叶片轮廓质心的神经网络分类器等这样高精度的系统识别分类方法,所获得的识别率也较高[6-8]。但这些技术都得依赖计算机分类等技术,专业性较强,难以普及,且部分的研究中并未对叶片的种属进行识别,而在植物鉴定的研究中,仅对单一叶片识别,意义不大。本研究选取的是杨柳科(Salicaceae)7 种同为柳属(Salix Linn.)的植物,旨在找出有效的叶片特征的数字化指标,运用数学统计分析方法,通过植物叶片简单、快速、有效地识别7 种柳属植物,为今后植物物种识别及鉴定工作提供新方法。

1 材料与方法

选取了7 种较常见的柳属植物,为大黄柳(Salix raddeana Laksch.ex Nas.)(1 号)、粉枝柳(Salix rorida Laksch.)(2 号)、谷柳(Salix taraikensis Kimura)(3 号)、旱柳(Salix matsudana Koidz.)(4号)、蒿柳(Salix viminalis Linn.)(5 号)、杞柳(Salix integra Thumb.)(6 号)、崖柳(Salix floderusii Nakai)(7 号)。采集地点在东北林业大学凉水实验林场,采集时间为2013年7月,叶片采集要求为成熟的完整叶片,采集数量为每种50 片。

试验初处理:试验植物共7 种,每种50 枚叶片,共计350 枚,去叶柄,擦净叶面,用扫描仪在分辨率300 像素/英寸下从叶片背面进行扫描。

试验数据的测量:用图像处理分析软件Image-Pro Plus 6.0 完成。

试验数据处理:数据的整理及特征指标的计算用Microsoft Excel 2003 实现,统计分析、相关性分析、判别分析用SPSS 19.0 实现。

2 数字特征与判别指标

2.1 数字特征定义

叶宽(B):叶片平展,图像上最宽处左右两点连线的长度。

最宽处距离(D):即叶宽到叶片基部的距离。

叶长(A):以叶宽为基线,叶片先端点到叶宽的距离与叶片基部点到叶宽的距离之和。

叶周长(C):即叶片图像中叶片边缘围成叶片图像的弧线全长。

叶面积(S):即叶片图像中叶片边缘围成叶片图像的面积。

较长距(L1)与较短距(L2):叶片图像最宽处左右两点分别与叶先端点的连线的距离,较长的距离称为较长距,较短的距离称为较短距。

较长弧(l1)与较短弧(l2):叶片图像最宽处左右两点分别沿叶片图像边缘到叶先端点的弧线,较长的弧线称为较长弧,较短的弧线成为较短弧。

叶周长(C):即图像中,叶片边缘围合成的图形的全长。

叶面积(S):即图像中,叶片边缘围合成的图形的面积。

叶包膜定义为叶缘相邻锯齿最高点的两两连线围成的图形。叶包膜周长(C1):即叶包膜所围成的图形的周长。叶包膜面积(S1):即叶包膜所围成的图形的面积。全缘叶是指叶缘平整的叶,故全缘叶的叶包膜与叶片重合,即C=C1,S=S1。

叶宽以上叶片面积(S2):即由叶宽截取的叶片上部的面积。

外接矩形:即以叶长为外接矩形的长,叶宽为外接矩形的宽。

2.2 判别指标的定义与计算

近圆度(P):图像接近圆形的程度,也能反映叶片边缘的复杂程度,即叶周长的平方与叶面积之比。公式:P=C2/S。若值越接近4π,则图像越接近圆,若值越大,则越远离圆形。相同面积的叶片,叶缘越复杂,近圆度值越大。

长宽比(Ⅰ):叶片图像的宽窄程度,反映的是叶片的轮廓,即叶长与叶宽的比值。公式:Ⅰ=A/B。

最宽处位置(W):叶片图像上最宽处在叶片长轴(即叶长)上的位置。公式:W=D/A。

外接矩形面积比(JQ,简称外矩面积比):通过叶长、叶宽围成外接矩形的面积与叶面积的比值。公式:JQ=A×B/S。

外接矩形周长比(JZ,简称外矩周长比):通过叶长、叶宽围成外接矩形的周长与叶周长的比值。公式:JZ=(A+B)×2/C。

较长弧距比、较短弧距比(CH、DH):叶先端点到叶片图像最宽处左右两点轨迹的复杂程度。较长弧距比即为较长弧与较长距之比,较短弧距比即为较短弧与较短距之比。公式:CH=l1/L1、DH =l2/L2。若弧距比值越大,则轨迹越复杂。

上外距面积比(Q):在叶宽以上部的叶片图形的外接矩形面积与叶宽以上图形面积的比值。公式:Q=(A-D)×B/S2。

叶包膜面积比(MQ):叶缘相邻锯齿最高点的两两连线围成的图形的面积与叶片面积的比值。公式:MQ=S1/S。叶包膜面积比值越大边缘复杂程度越大。

叶包膜周长比(MZ):叶缘相邻锯齿最高点的两两连线围成的图形的周长与叶片周长的比值。公式:M=C1/C。叶包膜周长比值越小边缘复杂程度越大。

3 结果与分析

3.1 判别指标的稳定性

为了确定拟选择的判别指标,是否可以作为每种植物叶片稳定的相对指标,运用SPSS19.0 计算出7 种柳属植物的不同指标的平均值和标准差。由于每种植物叶片的各项指标的平均值不同,故不能运用标准差来衡量数据的变异程度。因此,选取变异系数(如表1)来验证数据的稳定性,变异系数CV=(标准偏差SD/平均值MN)100%。

表1 7 种柳属植物判别指标的变异系数

根据表1的数据所示,各组数据的变异系数都较小,故判别指标的变异程度低,数据相对稳定,选取的判别指标可以作为稳定数据进行接下来的分析实验。因3 号(谷柳)、5 号(蒿柳)、6 号(杞柳)、7号(崖柳)植物均为全缘叶,叶包膜图形就是叶片图形,故叶包膜面积比、叶包膜周长比均为1,其变异系数为0。

3.2 单一指标判别

因选取的判别指标变异程度低,每种柳属植物的各项指标数值相对稳定,所以先运用SPSS18.0 对选取的判别指标分别进行一次典型判别分析(Canonical Discriminant Analysis,CDA,基于典型相关分析原理估计判别参数,并用得到的判别函数进行判别分析,这种做法叫典型判别分析),得出各单一指标对7 种植物典型判别分析的判别正确率。

如表2所示,单一指标对7 种植物的判别正确率较低,综合判别正确率的由大到小的顺序依次为:长宽比、近圆度、外矩周长比、叶包膜面积比、最宽处位置、外矩面积比、叶包膜周长比、较短弧距比、较长弧距比、上外距面积比,仅特征指标长宽比、近圆度、外接矩形周长比的综合判别正确率达到50%,但在针对部分种的识别率较低,如:长宽比对6 号植物的判别正确率仅为38.5%,近圆度对4 号植物的判别正确率为47.1%,外接矩形周长比对1 号、4 号、7 号植物都没有达到50%的判别正确率。故仅用单一判别指标对植物进行判别分析是远远不够的。

表2 判别指标对7 种柳属植物的判别正确率

3.3 双重指标的判别

在单一指标判别分析中,所有指标对7 种柳属植物均未能达到较好的识别结果。如果将单一指标两两组合,是否可以提高判别正确率,且两两相关性显著的指标组合是否也可以提高判别正确率,有待于探究和分析。故先对所选的判别指标两两做双变量相关分析,然后用相应的指标组合对7 种植物做典型判别分析,进行比较分析。

表3 判别指标相关分析双侧检验P 值

由表3所示,45 组特征指标组合中相关性不显著的组合只有12 组,分别为:近圆度×上外距面积比、近圆度×叶包膜面积比、近圆度×叶包膜周长比、长宽比×叶包膜面积比、最宽处×外矩周长比、最宽处×较长弧距比、最宽处×较短弧距比、外矩面积比×较长弧距比、外矩面积比×较短弧距比、外矩周长比×上外距面积比、较长弧距比×上外距面积比、较短弧距比×上外距面积比。

而由相应的指标组合得出的判别分析结果所示(表3),除叶包膜面积比×叶包膜周长比对单一指标叶包膜面积的综合判别正确率没有提高(均为45.0%),其他的组合均得到明显的提高,其中两两相关性极显著的指标组合后也对植物的判别正确率有所改善,如近圆度×长宽比的判别正确率为90.6%,而近圆度对7 种植物的判别正确率为63.3%,长宽比为76.7%。

表3中指标组合的判别分析结果得出,有部分指标组合的综合判别正确率达到85%以上,可以作为有效的指标组合对7 种柳属植物进行判别分析。达到85%的指标组合有:近圆度×长宽比、近圆度×外矩面积比、长宽比×外矩面积比、长宽比×外矩周长比、最宽处×外矩面积比,其中近圆度×长宽比为最优,综合判别正确率达到90.8%。

表4 判别指标两两组合的判别分析结果

3.4 最优指标组合的判别结果

近圆度和长宽比判别指标组合为最优识别指标,对于7 种柳属植物的典型判别的判别式函数式有2 个,分别为F1=-0.049x1+1.972x2-7.912,F2=0.479x1- 2.632x2- 4.063。典型判别函数(F1、F2)分别占总方差的86.4%、13.6%(表5)。

表5 典型判别函数的判别

近圆度和长宽比指标组合对7 种柳属植物的判别分析结果(表6)所示,最优指标组合对1 号、2号、5 号植物可以完全识别,3 号、4 号植物的识别率超过90%,6 号植物为61.5%,容易被错判至3号、7 号,7 号植物的判别率为77.8%,容易错判至3 号、6 号。

表6 最优指标组合对7 种柳属植物典型判别的正确率

4 结论与讨论

通过对植物叶片图像的观察分析,提取植物叶片的多个特征参数,如叶长、叶宽、叶周长及叶面积等,并最终确定了10 项植物叶片的相对特征指标,运用统计分析的方法,对植物叶片做识别检验,从而达到识别植物物种的目的。本实验选取的指标均为稳定的相对指标,并分别进行了单一指标和双重指标的典型判别分析。运用单一指标对7 种柳属植物进行典型判别分析时,每项特征指标的综合判别正确率都较低,最优的判别正确率仅达到76.7%,几乎是无法识别植物,需要多项指标组合才能得到较好的识别结果。在双重指标的判别分析中,除叶包膜面积比×叶包膜周长比对单一指标叶包膜面积的综合判别正确率没有提高(均为45.0%),其他所有的双重指标相比于单一指标的识别结果均得到明显的提高,其中部分指标组合的综合判别正确率达到85%以上,可以作为有效的指标组合对7 种植物进行判别分析,近圆度×长宽比的指标组合为最优识别指标组合,综合判别正确率达到90.8%,这说明运用近圆度×长宽比指标组合就可以较好识别出这7 种植物。通过以上实验结果及相关讨论表明,实验中选取的7 种植物,用“近圆度”、“长宽比”两项特征指标组合就可以很好的将其叶片识别出来,其中对1 号、2 号、5 号植物可以完全识别,3 号、4 号识别率超过90%,对6 号植物的判别正确率为61.5%,7 号植物为77.8%,对所有植物的判别正确率均超过60%,综合判别正确率达到90.8%。

国外对植物数字化信息的研究也有很多[9-10],主要集中在形态学图像处理方法及计算方法的研究上,对于植物叶片本身的基础信息涉及较少。在传统的植物分类中,叶片形状也作为识别植物的重要特征,本文中“长宽比”指标的选取与传统的植物分类方法保持了一致性,但本研究将叶片的主观识别特征转化为客观的数字参数,更为科学和可靠。很多人对杨属、柳属植物的区别常误认为是“窄叶为柳,宽叶为杨”,但其不然,实验数据所示,大黄柳、谷柳的叶片就较宽,叶宽约为叶长的2 倍左右,而粉枝柳、旱柳、蒿柳的叶片就很细长,特别是蒿柳,叶长达到叶宽的13 倍之多,说明柳属下的这7 种植物叶片的长宽比存在着很大的差异。

本实验还存在一定局限性,如采集地点较集中,限定了采集要求,对所有地区的柳属植物识别可能还不能完全适用,这些都有待于后续的研究分析。但本实验成功的说明了特征信息数字化的可行性,将人工变为自动,将人脑变为电脑,将大大提高植物识别的效率。随着科学技术水平的不断发展和更新,叶片的特征信息测量必将更加简便、快捷,客观数据的分析代替形态术语的描述,将大大提高植物识别的准确度。

[1] 张志翔.树木学:北方本[M].北京:中国林业出版社,2008.

[2] 胡仁勇,丁炳扬,黄涛,等.国产菱属植物数量分类研究[J].浙江大学学报:农业与生命科学版,2001,27(4):419-423.

[3] 阮仕立.中国野生葡萄种质资源描述标准及其计算机管理的研究[D].杨凌:西北农林科技大学,2001.

[4] 祁亨年,寿韬,金水虎.基于叶片特征的计算机辅助植物识别模型[J].浙江林学院学报,2003,20(3):281-284.

[5] 祁亨年.植物外观特征自动获取及计算机辅助植物分类与识别[J].浙江林学院学报,2004,21(2):222-227.

[6] Kue Bum Lee,Kwang Woo Chung,Kwang Seok Hong.An implementation of leaf recognition system based on leaf contour and centroid for plant classification[J].Ubiquitous Information Technologies and Applications,2013,214:109-116.

[7] Xia Chunlei,Jang Myung Lee,Li Yan.Plant leaf detection using modified active shape models[J].Biosystems Engineering,2013,116(2):23-35.

[8] Neto J C,Meyer G E,Jones D D,et al.Plant species identification using elliptic fourier leaf shape analysis[J].Computers and Electronics in Agriculture,2006,50(2):121-134.

[9] Menesatti P,Costa C,Paglia G,et al.Shape-based methodology for multivariate discrimination among Italian hazelnut cultivars[J].Biosystems Engineering,2008,101(4):417-424.

[10] Cope J S,Corney D,Clark J Y,et al.Plant species identification using digital morphometrics:a review[J].Expert Systems with Applications,2012,39(8):7562-7573.

猜你喜欢
叶宽圆度包膜
假包膜外切除术治疗无功能型垂体腺瘤的疗效
马奶子葡萄叶面积评估模型的建立
改进天牛须搜索算法在圆度误差评定中的研究
回归方程法测定两个龙眼品种叶面积研究
基于支持向量机的水稻叶面积测定
魔芋葡甘聚糖-乙基纤维素包膜尿素的制备及其缓释性能
磨加工主动测量仪在线圆度评定理论研究
洛阳市13种绿化树种叶面积的回归测算
发动机气缸套内孔圆度测量分析
基于几何动态模型的圆度误差分离模拟