基于光纤光谱技术无损检测猕猴桃硬度

2020-12-01 11:35孟庆龙尚静黄人帅张艳
食品与发酵工业 2020年22期
关键词:猕猴桃波长校正

孟庆龙,尚静,黄人帅,张艳

1(贵阳学院 食品与制药工程学院,贵州 贵阳,550005)2(贵阳学院 农产品无损检测工程研究中心,贵州 贵阳,550005)

猕猴桃属于后熟型水果,为了延长其贮藏期,经常采摘还未成熟的果实,但是如果过早采摘,果实就会特别生硬,影响口感,果实也易受冷害;若过晚采摘,果实十分柔软就会因为易腐烂而难以贮藏[1]。猕猴桃的硬度是衡量其成熟度的关键指标之一,因此,开展猕猴桃硬度的快速无损检测对于指导其采收时间、采后储藏和加工具有重要意义。

水果硬度的传统检测方法是将果实硬度计的检测探头压入水果果肉中检测其硬度[2],然而这种方法最大的缺点是破损样本。基于光谱技术的无损检测方法具有诸多优势,如分析速度快、无污染、无损伤等,近年来,这种方法已被广泛地用于水果品质的快速检测,引起国内外研究学者的颇多关注[3-8]。目前,研究人员已开展了关于香蕉[9]、苹果[10]、桃[11]、李子[2,12]、梨[13-14]和蓝莓[15]等水果硬度的无损检测,并取得了一定的成果。邵园园等[16]利用高光谱成像技术快速无损检测了猕猴桃货架期,研究发现猕猴桃的硬度值随着货架期的延长而逐渐减小,与货架期表现出负相关性。HU等[17]无损监测了1-甲基环丙烯对成熟期猕猴桃中糖分积累的诱导机制。尚静等[18]采用光纤光谱技术结合化学计量学实现了李子硬度的无损检测,其连续投影算法-误差反向传播网络(successive projections algorithm-back propagation,SPA-BP)模型的预测集相关系数(rp)和均方根误差(root mean square error of prediction,RMSEP)分别为0.70和1.61 kg/cm2。但是,关于不同成熟期猕猴桃硬度无损检测的研究却未见报道,而且在水果品质无损检测中应用光谱技术存在数据量冗余的问题,严重影响了预测模型的检测效率。

本文采用光纤光谱采集系统获取不同成熟期“贵长”猕猴桃的反射光谱;为预测猕猴桃硬度分别构建基于全光谱数据的主成分回归(principal component regression,PCR)和偏最小二乘回归模型(partial least square regression,PLSR);然后分别利用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)以及连续投影算法(successive projection algorithm,SPA)对全光谱数据进行降维,并基于特征光谱构建猕猴桃硬度的多元线性回归(multiple linear regression,MLR)预测模型,以期为猕猴桃硬度无损检测装备的开发提供理论基础。

1 材料与方法

1.1 实验材料

不同成熟期(未熟期、半熟期、成熟期、过熟期)“贵长”猕猴桃于2019年9月17日至2019年10月19日分4批次采自贵州省修文县龙关口猕猴桃果园,样品从不同的果树上随机采摘,每批次采摘50个无病虫害且无机械损伤的样品,共计200个。样品采摘后立即运到实验室,在实验室温度为(22±2) ℃条件下贮藏,用柔软的纸品轻轻擦掉猕猴桃样品表面的尘土等杂物,依次对其编号后采集光谱并测量硬度。

1.2 实验仪器

光纤光谱采集系统,蔚海光学仪器(上海)有限公司,该系统主要由QEPro光谱仪(波长为198.2~1 006.4 nm,分辨率为2.84~3 nm)、R600-7-VIS-125F光纤(直径为600 μm)、HL-2000卤钨灯光源(波长为360~2 400 nm)、RPH-1反射探头支架、RPH-ADP适配器、WS-1标准反射白板以及Lenovo计算机等构成,系统结构如图1所示。

图1 光纤光谱采集系统Fig.1 Optical fiber spectroscopy acquisition system

GY-4数显果实硬度计,杭州绿博仪器有限公司。

1.3 反射光谱采集

将待测猕猴桃紧贴在反射探头支架RPH-1上(通过RPH-ADP适配器将反射探头固定在反射探头支架RPH-1上,反射探头支架表面距离样本约1 cm),光谱采集部位为猕猴桃赤道位置,5次采集的平均值作为该样本的光谱数据。系统的积分时间为110 ms,扫描平均次数为8,滑动平均宽度为1,光谱采集由软件OceanView控制完成。

1.4 硬度的测量

实验使用数显果实硬度计测量猕猴桃样本的硬度,硬度计的探针直径为7.9 mm,探头压入果子的深度约10 mm,计量单位为kg/cm2。测量时先将猕猴桃样本测量部位去皮,然后将探头正对果肉处,缓慢匀速压入,至刻线处止,每个猕猴桃样本分别测量3个位置,3次测量结果的平均值作为该样本的实测值。

1.5 光谱降维及模型评价

1.5.1 特征光谱提取

实验采取SPA和CARS选取特征波长。SPA是一种将矢量空间共线性最小化的前向变量选择方法,其优点在于从全光谱中选取若干个特征波长,来消除原始光谱中的多余信息,通常依据预测集均方根误差的最小值来选定最佳的特征波长数;CARS依靠指数衰减函数对每一次循环建立的偏最小二乘模型中回归系数绝对值最大的因数进行选择,同时采用自适应重加权采样技术去掉权重小的因数,经过多次重复选择,选出交互验证均方根误差值最小的变量子集。特征光谱的提取在MATLAB R2016b软件中执行。

1.5.2 建模方法及模型评价

对全光谱数据进行降维处理后,分别基于全光谱和特征光谱数据建立了猕猴桃硬度PCR、PLSR和MLR模型。PCR方法的主体思路是先将自变量进行主成分分析,然后用主成分替换原自变量后与因变量做多元线性回归,而PLSR是同时对自变量和因变量做主成分分析的一种多元线性回归分析方法。当有m个自变量X(光谱数据),即X1,X2,X3,…,Xm,则自变量X和因变量Y(硬度实测值)之间具有线性回归方程,如公式(1)所示:

Y=β0+β1X1+...+βmXm+ε

(1)

设观察值为{(Yi,Xi1,…,Xim),i=1,2,…,n},则MLR模型可以表示成如公式(2)所示方程:

(2)

(3)

(4)

(5)

(6)

(7)

式中:nC和nP为校正集和预测集中的样本数,yact和ymean为样本参考值实测值和平均值,ycal和ypre为校正集和预测集中样本预测值,SD表示预测集中样本实测值的标准偏差。

2 结果与分析

2.1 猕猴桃硬度统计分析

不同成熟期猕猴桃硬度的统计结果如表1所示,猕猴桃的硬度值随着其逐渐成熟而减小。在构建回归预测模型之前,需要基于采集的光谱数据和测量的硬度值将所有猕猴桃样本划分为校正样本集和预测样本集,校正集中硬度值的范围要比预测集的范围宽是划分样本集的评判标准。本文利用SPXY(sample set partitioning based on jointx-ydistances)方法[20]将200个猕猴桃样本按照3∶1划分成150个校正样本集以及50个预测样本集。校正样本集和预测样本集中猕猴桃硬度统计数据见表2,频率分布图如图2所示,校正集中猕猴桃硬度的范围比预测集中的范围宽,这样划分的样本集有助于后期建立较优的预测模型。

表1 不同成熟期猕猴桃硬度统计结果 单位:kg/cm2

表2 校正集和预测集中猕猴桃硬度统计结果 单位:kg/cm2

图2 猕猴桃硬度频率分布图Fig.2 The probability distribution of the firmness of kiwifruit

2.2 反射光谱及预处理

由于原始光谱的首末两头含有较多的噪声,因此剔除前10个和后10个波长,选择波段为206.33~999.06 nm的作为有效光谱,该区域共有1 024个波长。为了提升预测模型的精确度和稳定性,在建模之前采取多元散射校正(multiplicative sactter correction,MSC)对原始光谱数据进行预处理。图3给出了猕猴桃样本的原始反射光谱(图3-a)以及经过MSC(图3-b)预处理后的相对反射光谱。由图3可知,在波长675 nm附近的吸收峰是由表面叶绿素的吸收而产生的,反映了猕猴桃表面的颜色信息,波长980 nm附近的吸收峰则是由水分的吸收而产生的,体现了猕猴桃的水分含量信息。

a-原始光谱;b-MSC预处理后光谱图3 猕猴桃反射光谱Fig.3 Reflectance spectra of kiwifruit

2.3 基于全光谱的建模结果

表3 PCR和PLSR模型对猕猴桃硬度的预测结果Table 3 Firmness prediction results of kiwifruit by PCR and PLSR model

2.4 光谱数据降维

2.4.1 采用SPA提取特征波长

利用SPA提取特征波长时,通常依据RMSEP的最小值来选定最优的特征波长数。RMSEP随SPA中有效波长数的变化情况如图4-a所示,表明RMSEP随有效波长数的增加而减小,当有效波长数>7时,RMSEP减小的趋势不明显,因此将这7个波长(占总波长量的0.68%)作为特征光谱。图4-b给出了提取的特征波长分布图。

a-RMSEP随SPA中有效波长数的变化情况;b-提取的特征波长图4 SPA算法提取特征波长结果Fig.4 The results of characteristic wavelengths selection by SPA algorithm

2.4.2 采用CARS选取特征波长

利用CARS选取特征波长时,其蒙特卡洛取样次数设定为50次,利用5折交叉验证方法计算所建立的偏最小二乘(partial least squares,PLS)模型的交叉验证均方根误差(root mean square error of cross validation,RMSECV)。图5给出采用CARS算法提取特征波长的结果,其中不同采样次数下RMSECV的变化规律如图5-c所示,可以看出第26次采样获得的RMSECV值最小,有42个特征波长(占总波长量的4.1%)包含在该最优波长集中(如图5-b所示),图5-d给出了提取的特征波长分布图。

a-回归系数变化路径;b-每次采样中变量的变化情况;c-不同采样次数下RMSECV的变化情况;d-提取的特征波长图5 CARS算法提取特征波长结果Fig.5 The results of characteristic wavelengths selection by CARS algorithm

2.5 基于特征光谱的建模结果

表4 基于特征光谱构建的MLR模型对猕猴桃硬度的预测结果Table 4 Firmness prediction results of kiwifruit by MLR model based on the characteristic spectra

图6 硬度实测值与预测值散点图Fig.6 The scatter plot of the measured versus predicted values of the firmness

3 结论

为解决光纤光谱技术应用在水果品质无损检测中存在数据量冗余的难题,对全光谱数据降维结果表明应用SPA和CARS分别在1 024条全波长里挑选出7个和42个特征波长,明显提升了预测模型的运行效率。

猜你喜欢
猕猴桃波长校正
摘猕猴桃
猕猴桃落果咋应对
杯中“日出”
提取猕猴桃的DNA
劉光第《南旋記》校正
摘猕猴桃
基于MR衰减校正出现的PET/MR常见伪影类型
在Lightroom中校正镜头与透视畸变
机内校正
基于频域分析方法的轨道高低不平顺敏感波长的研究