花卉识别的前沿技术

2018-03-25 00:34
城市建设理论研究(电子版) 2018年23期
关键词:图像识别特征提取分类器

鹤壁高中 河南 鹤壁 458000

正文:

引言:

花卉,具有观赏价值的草本植物,是用来欣赏的植物的统称,喜阳且耐寒,具繁殖功能的短枝,有许多种类。花卉通常由花卉、花冠、花萼、花托、花蕊组成,有各种各样的颜色,有的长的很艳丽,有香味。而图像识别技术是人工智能一个重要领域,为识别各种不同模式和对象的技术。近年来,我国科技迅速发展,图像识别技术也日益成熟,本文以图像识别技术为基础,以花卉为识别对象对其进行快速识别并且分类,为人工智能技术提供经验。

一、识别系统概述

1.识别出花卉

前文中提到,花卉通常由花冠、花萼、花托、花蕊组成,且大多数为被子植物,通常生长在一个有限的短轴上,着其花冠与生殖器。通过使用图像分割技术将提取图像中的物体与背景分离,针对其纹理对其进行识别,判断是否为花卉。

2.对花卉种类识别

不同的花卉,其叶,枝花冠形状等都有明显的区别,可通过使用图像提取并在数据库里进行查找的方法来识别花卉。

二、特征提取

特征提取是花卉识别的重要环节,在辅以正确的算法对特征进一步分析。由于花卉种类较多,花冠颜色较为繁杂,所以花冠不具备较大参考价值。本论文以其叶茎、形状、纹理等方面进行分类。

1.形状特征提取

形状特征有利于分析花冠的瓣的层数,且光照,颜色对形状特征无太大影响,具较强鲁棒性。本论文主要采用最小外接矩形宽高比,凸包面积比,HU不变矩来描述牡丹形状特征

2.最小外接矩形宽高比

此算法针对花朵侧面图片,对于花卉来说可辨识花瓣层数。判断标准为花朵中间突出程度,此方法主要用于辨识侧面图片,而不适用于正面图片。

3.凸包面积比

凸包是正面图片中花朵的最小外接多边形,该特征用于花瓣层数,叶片厚度,叶片疏密程度。花瓣层数少者,相应花瓣间缝隙较大,层数多着相反。两类在凸包面积与花朵面积的比值上存在一定差异。此算法运用这种特征,用于定量描述花朵的形状特征,直观地呈现出不同花朵的不同差异。

4.HU不变矩

几何矩主要用于图像描述。不变矩是一种高度浓缩的图像特征,具平移、旋转与尺度不变形。一幅灰度图像可用于二维灰度密度函数表示。因此用矩来描述灰度图像特征,对其茎叶识别有很大帮助。

5.纹理特征提取

纹理是一种反应物体表面纹理脉络的视觉特征,它体现了物理表面具有缓慢变化的表面结构组织排列属性,可利用图像信息,兼顾其宏观性质,细微结构两个方面。

6.灰度共生矩阵

在图像任取一点以及偏离其的一点形成一个点对,并用函数表示初始的灰度值设为(i、j)令此点在整幅图上移动,得各种(i、j)值,则形成灰度联合概率矩阵(灰度共生矩阵)。根据不同的数值组合,可以得到不同情况下的联合概率矩阵。

三、分类器选择与模型计算

1.KNN算法

KNN算法是计算机算法中的一种监督、学习、识别算法。主要内容为给目标样本周围找个找个K“邻居”根据其邻居多少占比来赋予这个样本周围占比最大邻居的属性。

比较于其他图像识别算法、KNN算法的过程十分简单,而且是一种需要时刻重复“刷新”的计算方式。

KNN算法主要取决以下几个方式要素:

1.距离

KNN作为以邻居的占比来决定样本性质的算法,其距离自然就成了影响模型的重要因素之一。K值(距离)的选择直接影响其精确度与在图像识别上的正确率,若K值较小,则意味其复杂度与精确度会再上一层,同时届于拟合。但K值越大,模型越简单,K值过大,则结界将总是占比较高的样本。

根据图像识别的原理我们可知:图像识别的算法因为其识别对象的变幻与复杂性、需具备灵活多变性。

2.距离的度量

即测试样本与训练样本的临近程度,K的大小限制了其选择

3.分类权重

找好测试样本周围的训练样本范围后,我们就需要,根据训练样本决定测试样本属性,这时就需要制定好的决策规则,常用的有以下两种:①多数表决;②给予不同距离的测试样本不同的权值。C比如权值与距离成反比。

KNN的算法固然简便,但在实际应用正确率却并不高。并不是理想的图像识别算法。

2.线性分类器

机器学习的算法之一,大体内容为将具有相似特征的对象通过线性组合来做出分类决定。有两部分组成;评分与损失函数、对所处理数据问题进行优化,优化过程中通过更新评分函数的参数来最小损失函数值。在辨别图像如下应用:

图像是三维的,可拉伸为一个列向量,对其进行分类,即得出某值,占比最大。若训练数据中有3000张图像的数据,即可寻找不同图像(即所识别的图)权值比重,放入其分类器识别,占比高的一项即为这张图的属性。

总体来看,线性分类器实质上是一个学习模块,通过深度的数据学习来建立一个个模板,再将目标图片上的数据代入模块,进行配比。相较于KNN的设定区域进行对目标数据的定义,这种方法准确性较高,因为线性分类器并未用其所有数据进行一一比对,而是每次识别只用一张图(减少因数据太多太杂出错的概率)而且是使用内积计算,不是用L1.L2来觉得其权重。

3.卷积神经网络

以神经元为原理,即某一神经元可以影响其他神经元的高效识别方法,因为某方向性与独特结构而别应用,它可以有效的降低反馈神经网络复杂性与不稳定性,可以直接输入原始图像。卷积在此为内积,就是根据多个一定的权重(卷积核)对一个块的图像进行内积运算,重点位于由局部提取出的整体。一般来说,CNN的结构包括两部分,特征提取层、特征映射层。每层与其下一层紧密相连。并且逐层提取其特征,并对其数据进行记录,整理。二是特征映射层,每个计算层生多个特征映射层组成,每个特征提取层是一个平面,每个平面权值相同,因为特征提取性算法减小了结构的分辨率。

CNN的局部感知能力很强,多个反射层使其算法简便了许多。仅需在局部提取,最终在最高层进行整合即可。CNN相较于普通网络还有一个特点,横向读取,几个神经元横向对图片进行提取,相对于普通神经网络全部神经元都读取全部图片这一做法,卷积神经网络效率更高,读取更有规律性。图像处理步骤更加简便。

另外,池化也是其算法的特点之一,在部分特征提取时(假设划定某一区域提取)即选择该区域的最大值或平均值取代该区域,该算法使数据敏感度与算法复杂度降低。比较KNN算法过于死板,不注重变化,在图像识别中不推荐使用。线性分类器通过深度学习结果模型代入数据的方法虽好,但终究读取范围能力有限,需要人为进行大量调整,反复修改。相较之下,卷积神经网络运用局部特征提取的算法,减小了运算与数据处理的复杂度。两者在这一点上可以取长补短进行结合。两者在有光线影响遮挡的情况下,仍旧十分准确的识别出了目标图片中花卉的种类,识别用时几乎相同。相较之下,支付宝识花的准确率更大些(微软喜欢给出几个不同结果,虽然概率最大的那个是正确的)。

四、花卉识别的商用软件评估

通过使用支付宝与百度的实话技术后,我得出两者中的共同特点。

百度识花与支付宝识花都是运用类似线性分类器的算法运算——通过从海量图库中深度学习,建立起对界门纲目科种属的具体识知(即成立相对应的线性分类器)鉴于花卉植物的多样性采用单纯的KNN算法出错几率太大。花卉识别注重其递进性而不是整体性。而这时,卷积神经网络里的局部特征提取法就占了优势。我在运用支付宝识花软件与微信识花软件时的目标为巴粟,其判断结果都具有类似的纹路,外形且准确率也很高。此外,在辨识出花卉的同时亦能判断出其他物品所属种类,说明其算法具有灵活多变的特点。

猜你喜欢
图像识别特征提取分类器
基于Resnet-50的猫狗图像识别
基于Gazebo仿真环境的ORB特征提取与比对的研究
高速公路图像识别技术应用探讨
基于Daubechies(dbN)的飞行器音频特征提取
图像识别在物联网上的应用
图像识别在水质检测中的应用
基于实例的强分类器快速集成方法
Bagging RCSP脑电特征提取算法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器