基于CIE颜色空间构建烤烟外观质量预测模型

2018-09-11 08:24谭方利吴文信刘小斌李宏光徐辰生
河南农业科学 2018年8期
关键词:特征值烤烟烟叶

李 峥,谭方利,贺 帆,吴文信,刘小斌,李宏光,方 明,徐辰生,3*

(1.河南农业大学 烟草学院,河南 郑州 450002; 2.湖南省烟草公司 郴州市公司,湖南 郴州 423000; 3.福建省烟草公司 南平市公司,福建 南平 350003)

烟草是一种以叶片为收获对象且对其内外观品质要求非常高的特殊经济作物,烤后烟叶的外观质量是决定烟叶等级的重要指标之一[1-2]。对于烟叶外观质量的评价长期以来一直以人为感官判断作为评定依据[3],对烤烟外观质量的评定具有一定的主观性。随着计算机、现代仪器等学科的飞速发展,烟叶外观质量评价也应借助新的方法和仪器实现突破性的发展。其中,颜色作为国家烤烟分级标准的第二分组因素以及外观质量评价的重要指标[4],与烟叶外观质量和内在质量密切相关。早在1931年CIE(国际标准照明委员会)就建立了一系列表示可见光谱的颜色空间标准[5],目前,在烟草行业中主要应用于颜色参数与烟叶内在化学成分的相关分析,从而反映颜色与内在品质的关系[3-6],而烟叶外观质量的本质是化学成分的综合表现,从侧面反映出了烟叶表面颜色参数与外观质量存在某种关联。李悦等[7-8]研究了不同品种、部位的烤后烟叶表面颜色特征参数与外观质量之间的关系,结果表明,烤烟颜色特征参数与外观质量指标之间存在显著或极显著相关关系。

上述研究均反映了烟叶表面颜色参数与外观质量存在某种依存关系,而BP神经网络具备处理任何复杂非线性映射的功能,其无论在网络理论还是在性能方面均已比较成熟,近年来在经济、工业、医疗以及农业等领域均有广泛的应用[9-13]。烟草方面主要应用于感官质量的预测。彭黔荣等[14]和邵惠芳等[15]以常规化学成分含量为网络模型输入指标,路晓崇等[16]以烟叶颜色参数作为神经网络输入层分别构建了感官质量预测模型,结果均表明,各项感官质量评价指标网络模型的预测效果与实际得分拟合程度较高。而烟叶外观质量与感官质量密切相关[17]。为此,本研究以烤烟颜色参数为基础,利用BP神经网络构建外观质量预测模型,旨在为烟叶外观质量评价体系的智能化、精准化发展提供一定科学依据。

1 材料和方法

1.1 试验材料

参照中国烟草种植区划[18]对河南烟区的划分,河南烟区分为豫中、豫西、豫南、豫东4个生态区域,分别收集豫中烟区的襄城、郏县、临颍、舞阳,豫西烟区的洛宁、渑池、卢氏,豫南烟区的方城、内乡、确山,豫东烟区的鹿邑、睢县等12个县(市)的27个烤烟主产乡镇2017年初烤烟叶样品270个。经严格分选后,共获取248个烟叶样品。

1.2 试验方法

1.2.1 烟叶颜色特征值的获取 每个烟叶样品随机选取20片,采用Color-Eye7000A 型分光光谱仪(美国GretagMac-beth公司)在国家烟草专卖局制定的烟叶分级实验室环境[19]条件下测量烟叶正面和背面颜色的L*(明度值)、a*(红度)、b*(黄度)、C*(饱和度)以及H*(色相角)5个颜色特征值,以烟叶1/4、1/2、3/4处对称的6个位置作为测量点(图1),测量点距离主脉约5 cm,每片烟叶正面和背面共计12个测量位点。

图1 烟叶颜色特征值的测量位点

1.2.2 烟叶外观质量评价 外观质量评定前将烟叶样品平衡含水率至16%~18%,由聘请的10名农业标准化委员会烤烟烟叶分级专家参照《GB 2635—92烤烟分级标准》和烟叶外观质量测评标准(表1)对最终确定的248个烟叶样品的颜色、成熟度、叶片结构、身份、油分、色度等6项外观质量指标进行评价打分,其中各项外观质量评价指标最高得分值均为10,不同分值表示烟叶外观质量归属的不同档次。

表1 烤烟外观质量评价指标及评分标准

1.3 数据处理

试验数据采用Matlab 2014b与Excel 2010进行处理分析和作图。

2 结果与分析

2.1 烟叶样品颜色参数与外观质量基本特征

烟叶样品的颜色特征值及各项外观质量评价指标得分结果见表2。变异系数是概率分布离散程度的一个归一化量度[20],从烟叶样品正面和背面的颜色特征值统计结果可以看出,烟叶正面和背面的H*值变异系数分别为0.27%和0.20%,属弱变异,其余颜色参数的变异系数均在5%以上,尤其是烟叶正面的a*值,变异系数达到10.33%,烟叶背面颜色参数变异系数以L*值最大,为8.01%。烟叶外观质量评价各项指标的变异系数从大到小排列为油分>身份>色度>叶片结构>成熟度>颜色,其中仅颜色指标变异系数小于5%。可见,样本颜色特征值和外观质量指标的变异系数均小于15%,表明数据的稳定性较好。峰度和偏度可反映样本的集中趋势和变异程度,从表2可以看出,烟叶样品正面和背面颜色特征值的峰度和偏度均接近0,服从正态分布。外观质量中油分指标的峰度较高,达到了1.25,但表现为高狭峰,其余指标的峰度均小于1,结合偏度来看,各项外观质量指标均较小,同样服从正态分布,具有良好的统计学意义。

表2 样本的描述性统计

2.2 烟叶颜色特征值的因子分析

为避免数据冗余,对测得的烟叶颜色特征值进行因子分析,并将因子载荷矩阵方差极大正交旋转,在累计方差贡献率为95.49%(>90%)的前提下,最终分析得到5个主因子。从因子分析结果(表3)可以看出,因子1方差贡献率最高,为22.91%,因子5对烤烟颜色特征值的方差贡献率最低,为12.22%,其中因子2、因子3和因子4方差贡献率较为近似,分别为20.59%、20.03%、19.74%。相关系数统计结果表明,因子1主要反映了烟叶背面颜色特征值H*的影响;因子2和因子3主要反映了烟叶正反面颜色特征值b*和C*的影响;因子4主要反映烟叶正面颜色特征值a*的影响;因子5则主要反映了烟叶正面颜色特征值中L*的影响。

表3 烤烟颜色特征值与因子间的相关系数

2.3 BP神经网络数据处理与结构设计

采用3层BP神经网络(输入层、隐含层、输出层)创建烟叶外观质量评价预测模型。依据因子分析结果,烟叶背面L*值与各主因子间的相关系数均较低,因此,以248个烟叶样品的烟叶正面的5个颜色特征值以及烟叶背面的a*、b*、C*、H*共9个参数作为网络的输入值。以烟叶外观质量中颜色、成熟度、叶片结构等6项指标得分分别作为网络模型的输出值建立各自的预测模型。构建的BP神经网络模型输入层单元数为9,输出层单元数为1,隐含层单元个数依据经验公式(1)确定[21],

(1)

式中:p为隐含层节点数,n为输入神经元数量,m为输出神经元数量,α为经验值(1≤α≤10)。

训练样本中作为网络输入变量的9个烟叶颜色特征值存在较大差异,以叶片正面颜色参数为例,L*值变化为55.34~63.64,a*值则在10.28~22.17。输入变量之间的差异造成各分量尺度不一致,网络训练结果则会偏重于分量值大的变量,忽略分量值小的变量,进而影响网络的精准性;此外由于网络输入层至隐含层转换函数采用Sigmoid函数,数据差异较大可使神经元的输入值过早进入Sigmoid 函数的饱和区[22],使网络学习进程停滞。因此,对网络模型输入层数据采用离差标准化的方法(公式2)使结果落在[0,1]区间。

(2)

经计算,隐含层节点数在5~14,通过网络性能测试确定节点数为11的隐含层所构建的网络模型拟合残差最小。最终构建9-11-1的3层BP神经网络,结构如图2所示。

图2 BP神经网络模型结构

2.4 网络创建与训练

使用Matlab 2014b软件进行网络训练,将已经标准化处理的训练样本导入软件中,在输入层、隐含层、输出层参数设定的基础上,利用软件工具箱中的newff函数进行创建。输入层至隐含层的连接函数采用tan-sigmoid饱和正切函数,隐含层至输出层选用线性传递函数purelin以拓展输出值域,学习函数采用trainlm;在248个样品中随机选择80%作为训练样本,剩余20%为测试样本;训练步数设定为100,反复训练2 000次,目标误差精度设置为10-3,学习速率设为0.1。其余参数设置均使用系统默认值,依据上述设定标准,设计以下程序代码:

net=newff (minmax(P),[11,1],{‘tansig’ ,‘ purelin’ },‘trainlm’);

net.divideFcn=‘dividerand’;

net.divideMode=‘sample’;

net.divideParam.trainRatio=80/100;

net.divideParam.testRatio=20/100;

net.trainParam.Show=100;

net.trainParam.goal=0.001;

net.trainParam.Epochs=2 000;

net.trainParam.lr=0.1;

[net,tr]=train(net,P,T);

a=sim(net,P)

代码中,P为烟叶颜色特征值,T为烟叶外观质量评价指标;minmax(P)表示由9个训练样本的输入矩阵P的最大值和最小值组成的9×2维矩阵;[11,1]表示隐含层和输出层神经元个数;tansig和purelin分别表示隐含层和输出层采用的传递函数;trainlm指训练函数采用L-M优化算法以降低网络对误差曲面局部细节的敏感度,防止网络陷入局部极小值,并有效地提升网络收敛速度和泛化能力。

2.5 训练结果分析

通过对6项外观质量评价指标构建的网络模型进行训练和仿真。以训练完成后各项外观质量评价指标网络模型的模拟值为纵坐标,以该项外观质量评价得分目标输出值为横坐标,建立统计回归分析图(图3)。图中的直线为y=x,表示模拟值与目标输出值完全相同时的结果。由图3可知,所建立的网络模型的模拟值与目标输出值中颜色、成熟度和叶片结构3项外观质量评价指标的线性回归决定系数达到显著水平,身份、油分和色度的线性回归决定系数均达到极显著水平。表明各项外观质量得分的模型预测值与目标输出值非常接近。

分别对训练样本和测试样本的各项外观质量评价指标的模型预测值与目标输出值的差异进行统计,得到归属于不同误差区间的样本比例。从表4可以看出,各项外观质量评价指标预测值与目标输出值的误差区间在0~0.5的训练样本比例均达到80%以上,误差在0~1.0的训练样本比例均达到90%以上,表明模型预测结果的准确性较高。测试样本各项外观质量评价指标预测值与目标输出值的误差范围集中程度较训练样本分散,但整体也集中在较小的误差范围内,表明构建的外观质量预测模型具有较好的推广泛化性能。虽然有部分外观质量评价指标网络模型的预测值与目标输出值决定系数未达到极显著水平,且极少数样本的训练结果与目标输出值有较大偏差,但考虑到烟叶外观质量评价打分过程受人为因素影响较大,存在明显的主观性和随机性,因此,整体来看,所建立的神经网络模型的模拟效果较好,具有一定的可行性和实用性。

*、**分别表示模拟值与目标值相关性达到0.05和 0.01显著水平图3 训练后网络模拟值与目标值输出的统计回归分析

表4 单项外观质量评价指标预测模型输出误差情况统计

注:括号中内容为50个测试样本在各个误差区间所占比例。

3 结论与讨论

本研究利用BP神经网络构建了烤烟外观质量评价的预测模型,为加快网络收敛速度,采用因子分析法对作为输入层的烟叶正反面颜色特征值进行筛选,最终确定以烟叶正面的L*、a*、b*、C*、H*以及烟叶背面的a*、b*、C*、H*共9个参数作为网络输入指标,分别对颜色、成熟度、叶片结构、身份、油分、色度等6项外观质量评价指标得分进行预测。构建的模型拟合效果较好,预测精准度高。

虽然烤烟外观质量的本质是内在化学成分综合表现的结果[23],然而,烟叶中已被鉴定的化学成分高达3 035种[24],此外品种、部位等遗传因素以及田间生长过程、采后烘烤过程等环境因素均会影响烟叶的内在品质[25-28],最终影响烤烟外观质量的形成。若通过测量常规化学成分含量实现对外观质量的预测,既要考虑到测量过程的时效性,还需考虑测量结果的准确性,因此,实现外观质量评价过程的智能化仍需要进一步探究。烟叶颜色是叶内多种化学成分综合作用的外在表现。梁洪波等[3]、丁根胜等[4]、贺帆等[6]研究表明,烟叶颜色与其内在化学成分密切相关。再者随着现代仪器学科的发展,CIE颜色空间以非常具体的数据直观地反映烟叶表面的呈色特性,是一种快速、准确、无损的颜色检测方式,因此,基于烟叶表面颜色特征值实现对外观质量预测的模型是有效的。

预测模型的适用性应与我国烤烟生产模式密切相关,我国共有21个烟叶产区[18],生态条件和烟叶品种的差异可能造成烟叶颜色特征值和外观质量出现明显区别[29-30],而研究仅针对河南烟区部分代表性产区烟叶,模型的适用性方面有待探究。未来应针对烟叶产地、品种、部位建立相应的外观质量预测模型,结合仪器智能检测、计算机智能分析等先进技术和方法,建立多个不同层次的神经网络预测模型,形成一个庞大的模型集,随着数据量的不断扩大,网络模型的模拟效果会不断提升,预测结果更为精准。

猜你喜欢
特征值烤烟烟叶
不同部位烟叶化学成分与烟叶柔软度的关系
单圈图关联矩阵的特征值
不同成熟度烟叶烘烤过程中大分子物质代谢动态研究
烤烟上炕机械研制
迭代方法计算矩阵特征值
不同追肥对烤烟品质的影响
不同素质烟叶烘烤过程中生理及质地变化研究
关于新形势下烟叶生产可持续发展的思考
烤烟专用水溶根施肥技术介绍(二)
烤烟专用水溶根施肥技术介绍(一)