基于主成分分析和BP神经网络的蚕蛹分类方法

2017-02-05 23:17梁培生孙辉张国政方瑷
江苏农业科学 2016年10期
关键词:蚕蛹机器视觉BP神经网络

梁培生++孙辉+++张国政++方瑷++周二杰

doi:10.15889/j.issn.1002-1302.2016.10.124

摘要:为探究快速、无损进行蚕蛹雌雄分类的可行性,利用机器视觉技术对蚕蛹图像进行获取,应用主成分分析法结合BP人工神经网络方法进行分析识别。首先,对所得图像进行灰度化、滤波去噪、二值化、特征提取等预处理,再应用主成分分析法得到包含蚕蛹88.94%特征信息的4个主成分,将其作为BP神经网络的输入变量,对应的蚕蛹性别作为输出。建立1个BP神经网络的识别模型,该模型对于蚕蛹分类的准确率达到98%,符合我国农业部桑蚕行业的标准。机器视觉结合主成分分析和BP神经网络的方法能够准确进行蚕蛹分类,对实际生产具有积极的指导意义。

关键词:机器视觉;蚕蛹;主成分分析;BP神经网络;分类

中图分类号: TP391.41;S126文献标志码: A文章编号:1002-1302(2016)10-0428-03

收稿日期:2015-09-06

基金项目:国家科技支撑计划(编号:2011BAD33B04)。

作者简介:梁培生(1964—),男,广西苍梧人,副研究员,主要从事蚕业机械与装备研究。E-mail:305141797@qq.com。桑蚕养殖是我国的传统行业,也是中国重要的历史文化产业。为了最大限度地提高桑蚕业的经济价值及产品附加值,在实际生产中通常要将雌雄蚕茧分类使用。目前,蚕种场及相关生产企业往往在家蚕化蛹后的几天内手工进行雌雄蚕蛹分类鉴别工作,此方法不仅耗费大量人工成本,且因工人主观因素及技术程度的不同导致识别准确率不高,实际过程中还可能对蚕蛹造成伤害。近年来,关于蚕茧的无损检测法主要有近红外光谱技术、X射线成像技术等,但由于检测设备价格昂贵、检测精度及检测环境要求等原因均未得到推广。

不同性别的蚕蛹其身体形态、纹理特征有较大差异,人工识别是基于这些差异特性而进行的,因此可运用识别蚕蛹图像的方式达到目的。通过试验设备获得蚕蛹图像,对蚕蛹的形态特征、纹理特征进行提取并转化为数据信息,利用主成分分析和神经网络的方式进行识别。

1设备与材料

1.1试验设备

采用MER-125-30UM型工业摄像机(北京大恒图像公司)进行图像采集。采用自行设计的采集试验平台,包括环形光源、透明的PVC材料输送带、简易暗箱等。采用DELL的I5计算机主机,采用Matlab 12.0作为软件支持设备进行图像预处理、分析、模型建立、识别等。以上设备经过性能测试,均符合试验条件。

1.2样品

供试的150粒蚕蛹样品均由中国农业科学院蚕业研究所提供,其中雌雄蚕蛹各75粒。蚕蛹为同一品种在饲养条件基本一致的情况下培育,蚕蛹所处时期为化蛾期的前3~4 d,此时蚕蛹的形态特征未发生改变,且蚕蛹的纹理特征最为明显,利于对特征数据的准确提取。

2原理与方法

对工业摄像机采集得到的图像进行图像预处理和图像形状、纹理特征的提取,然后应用主成分分析对原始数据进行预处理,得到低维的主成分变量,作为BP神经网络的输入变量。利用建立的BP神经网络模型实现对数据的分析和识别。

2.1图像预处理及特征提取

通过设计的试验平台及试验设备采集蚕蛹图像,由于采集过程中受到设备、光线等条件的干扰,会产生一定的噪声,影响图像质量。通过对图像的预处理可去除图像的干扰及不必要的背景信息,获取高质量的目标图像。主要的预处理措施有图像的灰度化、滤波去噪、直方图均衡化、边缘提取、图像分割、二值化、形态学处理等(图1)。

经过预处理后,图像的质量得到提高,为图像的特征提取做好准备。试验共提取了150幅图像的周长、面积、偏心率、圆度、对比度、能量、逆差距、相关性、熵等9个信息量,为试验准备了充足的数据。

2.2主成分分析法

主成分分析是一种常用且重要的多元统计分析方法,该方法通过对相关范围内的数据结构内在关系进行分析研究,以方差最大化为原则,以多指标数据转化成较少数量的相互独立且能表示原数据大部分信息的变量为目的,对原始蚕蛹图像所包含的信息量进行线性拟合,从而得到较低维数的变量,取代原始高维数据变量。在实际试验应用中通常取前几个主成分,不仅能达到数据降维的目的,同时也利于数据的观察,一般推荐T值(各主成分的累积贡献率)应大于80%。该T值可用较少数量的不相关主成分表示原始数据,减少了数据的交叉及信息冗余;同时,通过对原始数据自身相关性进行分析来确定各分量权重,基于数据的内在结构关系,不需要人为确定,使试验结果更加公正、合理化且具有说服力。

2.3BP神经网络

误差反向传播网络(back-propagation network,BP)是人工神经网络的一种,是一种按误差逆传播算法原则进行训练的多层前馈网络,实现输入、输出变量之间的高度非线性映射关系。BP神经网络包括输入层、隐含层、输出层,同层之间相互独立,数据信息前向传播(图2)。该网络的学习规则为最速下降法,然后通过数据的反向传播来调整神经网络结构的各权重及偏置量,达到数据的误差平方和最小的目的,使网络的输出值逼近期望值,误差满足学习要求才结束。近年来,BP神经网络的应用在分类、预测等方面表现出优越性,本研究在蚕蛹分类中进行试验探讨。

3结果与分析

3.1主成分提取

利用主成分分析方法对蚕蛹图像提取出的数据进行优化,即输入各蚕蛹图像的特征数据,计算出其数据的特征矩阵以及各主因子载荷矩阵,然后选取合适的主成分矩阵,将二者组合得到的新向量作为BP神经网络的输入向量。主成分分析不仅能够降低神经网络的复杂程度,对提高网络模型的收敛速度和识别率也有较好作用。

蚕蛹图像经过预处理及特征提取后,将提取到的蚕蛹图像周长、面积、偏心率、圆度、对比度、能量、逆差距、相关性、熵等9个信息量作为原始数据。运用主成分分析的方法进行降维处理之后,在保证主成分的累积贡献率不低于80%的情况下,提取前4个主成分作为BP神经网络的输入变量,由此得到图像原始数据的特征值(表1)。

根据试验的精度及识别准确率要求,本试验取前4个较大的特征值,分别为5.261 3、1.280 3、0.929 4、0.533 1,此时累积贡献率达到88.935%。根据特征向量与原始数据组合形成的新向量,即分析后得到的主成分。每个图像样本的9

个信息量经主成分分析后化简为4个输入变量。

3.2BP神经网络

根据主成分分析结果(表1),选取前4个主成分即可表示蚕蛹图像的主要信息,使图像数据由原来的150×9减少至150×4,大幅降低了运算量。建立相应的神经网络模型,进行蚕蛹雌雄分类的训练和预测。将数据样本分为训练集和测试集,分别从雌雄蚕蛹中随机选取各50个样本用来建立模型,剩余的50粒蚕蛹用来预测结果。

利用Matlab 12.0软件编写程序,对输入变量进行数据归一化操作,并建立BP神经网络模型结构。经过多次试验对比分析,在输入层为4层、输出层为2层、系统允许误差为0001、学习速率为0.05、惯性系数为0.8、最大迭代次数为 1 000 次时,验证当神经网络隐含层神经元数目为8时,该神经网络模型结构较为简单,且收敛速度快、精度高。选取 4-8-2的网络结构进行训练和识别验证,其中隐含层传输函数为非线性的tansig型函数,输出层的隐含函数为纯线性的purelin型函数。

3.3PCA-BP模型预测

将经过降低维数处理的预测样本主成分数据在训练好的预测模型中进行验证,并利用网络的识别结果与蚕蛹的真实性别进行对比。由模型生成的神经网络回归图(图3)可知,模型的归一化系数均大于99.5%,即验证网络预测识别建立的模型对蚕蛹性别的识别较为成功。

一般来说,神经网络的性能优劣主要由其泛化能力来评价。对测试样本的验证分析表明,该网络模型具有很强的泛化能力,能够较为真实地反映输入与输出之间的关系。由图4可知,神经网络模型的训练收敛曲线在迭代次数为112时达到要求。检测结果(表2)显示,50粒蚕蛹的识别准确率达到98%。结果表明,本方法所建立的PCA-BP神经网络模型能够较为准确地对蚕蛹性别进行分类识别。

4结论

利用机器视觉技术获取蚕蛹图像,经图像处理得到了蚕蛹的形态及纹理特征,结合主成分分析法和BP神经网络结构建立了蚕蛹的雌雄识别模型,对蚕蛹进行分类识别研究。由对测试集的验证结果可知,蚕蛹的识别准确率达到了98%,但仍存在一定的误判率。BP神经网络的训练及网络记忆仍存在不稳定性,有待进一步研究。

机器视觉结合主成分分析和BP神经网络的方法,对蚕蛹的识别分类具有很好的作用,为蚕蛹雌雄识别分类提供了一种新途径,对桑蚕业具有重要的经济和实用价值。

参考文献:

[1]刘敬全,于振诚,崔玉梅,等. 家蚕荧光茧色判性蚕品种荧光、春玉的育成及其一代杂交种的选配[J]. 蚕业科学,1996,22(3):155-159.

[2]王茜蒨,黄志文,刘凯,等. 基于主成分分析和人工神经网络的激光诱导击穿光谱塑料分类识别方法研究[J]. 光谱学与光谱分析,2012,32(12):3179-3182.

[3]Jin T M,Wu X Q,Pan S Y,et al. Distinguishing sex of silkworm chrysalis in cocoon by NIR with fiber optics[J]. Acta Agriculturae Boreali-Sinica,1994,9:35-37.

[4]吴江,黄富荣,黄才欢,等. 近红外光谱结合主成分分析和BP神经网络的转基因大豆无损鉴别研究[J]. 光谱学与光谱分析,2013,33(6):1537-1541.

[5]李玉品,陈斌,颜辉,等. 近红外光谱分析法在蚕茧性别鉴定上的应用[J]. 江苏农业科学,2009(1):237-239.

[6]Chen Q S,Zhao J W,Fang C H,et al. Feasibility study on identification of green,black and Oolong teas using near-infrared reflectance spectroscopy based on support vector machine(SVM)[J]. Spectrochimica Acta,Part a,2007,66(3):568-574.

[7]蔡健荣,刘兵,李永平,等. X射线成像技术判别蚕茧性别[J]. 农业工程学报,2012,28(8):275-279.

[8]杨丹,赵海滨,龙哲,等. MATLAB图像处理[M]. 北京:清华大学出版社,2013.

[9]MATLAB中文论坛. MATLAB神经网络30个案例分析[M]. 北京:北京航空航天大学出版社,2010.

[10]马啸,袁洪福,宋春风,等. 衰减全反射红外光谱法快速分类和识别多种食用油的方法[J]. 光谱学与光谱分析,2015,35(7):1879-1884.

[11]岳田利,彭帮柱,袁亚宏,等. 基于主成分分析法的苹果酒香气质量评价模型的构建[J]. 农业工程学报,2007,23(6):223-227.

[12]Zhang J H,Qi L J,Ji R H,et al. Cotton diseases identification based on rough sets and BP neural network[J]. Transactions of the Chinese Society of Agricultural Engineering,2012,28(7):161-167.

猜你喜欢
蚕蛹机器视觉BP神经网络
好吃的炸蚕蛹(yǒng)
好吃的炸蚕蛹
吃蚕蛹
大场景三维激光扫描仪在研究生实践教学培养中的应用