基于可见/近红外光谱技术的玉露香梨可溶性固形物含量检测

2023-08-17 10:32孙海霞王润润张淑娟苏立阳卢心缘
农产品加工 2023年14期
关键词:玉露香梨波长

孙海霞,王润润,张淑娟,任 锐,苏立阳,卢心缘

(山西农业大学农业工程学院,山西 晋中 030801)

玉露香梨是山西省特色农产品,富含糖、维生素等多种营养物质,果肉酥脆、口味香甜,深受消费者喜爱[2]。可溶性固形物含量(Soluble solids content,SSC) 是衡量水果品质的一个重要指标,影响果实的营养成分和口感。因此,SSC 检测对提高玉露香梨的附加价值、满足消费者需求具有重要意义。

可见/ 近红外光谱技术[2]利用样本内部的X-H(C、O、N 等) 基团的倍频与合频的吸收特性获取样本光谱信息,结合化学计量学方法可实现样本品质的快速、无损检测。王世芳等人[3]为了实现对西瓜可溶性固形物检测,采用光谱-理化值共生距离(SPXY) 算法对不同检测部位的样品集进行划分,建立偏最小二乘回归预测模型,预测集相关系数(Rp) 和均方根误差(RMSEP) 分别为0.864 和0.33%。田喜等人[4]利用近红外光谱技术,分析了检测姿态对检测模型的影响,建立了苹果整果的糖度检测模型,Rp 和RMSEP 分别为0.79 和0.84%。盛晓慧等人[5]在库尔勒香梨可溶性糖的检测中,基于可见/近红外光谱技术采用无信息变量消除算法进行特征波长的提取,并建立了最小二乘支持向量机(Least Squares Support Vector Machine,LS-SVM) 检测模型,决定系数(Rp2) 为0.976、预测均方根误差(RMSEP) 为2.313。张立欣等人[6]基于近红外光谱技术,利用BiPLS 结合SPA 进行了苹果SSC 检测,Rp 和RMSEP 为0.898 1 和0.937 1。赵小康等人[7]提出基于无监督主动学习方法进行了苹果SSC 和硬度的光谱检测,与其他算法相比RMSEP 降低了2.0%~13.2%。

以玉露香梨为研究对象,基于可见/近红外光谱技术进行SSC 检测,采用多种算法进行预处理,采用采用竞争自适应加权(Competitive Adaptive Reweighted Sampling,CARS) 算法和连续投影算法(Successive Projections Algorithm,SPA) 提取特征波长,采用偏最小二乘回归(Partial Least Squares Regress,PLSR) 建立检测模型,分析不同特征提取方法对检测模型的影响,实现玉露香梨的SSC 快速检测。

1 材料与方法

1.1 样本采集

玉露香梨样本,采集自山西省太谷区白城村,选取成熟度一致、无损伤、尺寸形状一致的样本。样本采后当天运回实验室,将样品清洗干净并置于实验室条件下4 h,以恢复至室温。共选取试验样本179 个,采用KS 算法分为校正集(110 个样本) 和预测集(69 个样本)。

1.2 光谱数据采集与可溶性固形物含量的测定

采用美国ASD(Analytical Spectral Device) 公司生产的光谱仪采集玉露香梨样本的漫反射光谱信息。每个样本扫描3 次取其平均值作为光谱数据(见图1)。各个样本光谱曲线的变化趋势相似。光谱曲线的范围为350~2 500 nm,在970 nm 和1 400 nm附近均有与O-H 相关的吸收峰。在350~450 nm 范围内和2 475~2 500 nm 范围内信噪比较低,噪声大。因此选择450~2 475 nm 所对应的光谱信息进行后续的分析。

玉露香梨原始光谱曲线见图1。

采用手持式折光仪测定每个样本的SSC,最大值为12.10%,最小值为8.2%。

样本SSC 的统计结果见表1。

表1 样本SSC 的统计结果 / %

1.3 数据处理方法及模型评价

采用CARS 和SPA 算法提取特征波长,采用偏最小二乘回归[8]建立预测模型。CARS 算法通过自适应重加权采样技术将回归系数大的波长点保留,将权重小的点去除,模仿了达尔文进化论的“适者生存”原则,通过交叉验证选取交叉验证均方根误差小的变量组合[9]。SPA 能够很好地消除特征波长之间存在的共线性问题,而且避免了重叠信息的重复提取[10-11],简便快捷。

所建模型采用校正集的决定系数(Determination coefficient of calibration,Rc2) 和均方根误差(Root mean squared error of calibration,RMSEC)、预测集的决定系数(Determination coefficient of prediction,Rp2) 和均方根误差(Root mean squared error of prediction,RMSEP) 来评价模型的性能。

2 结果与分析

2.1 光谱数据预处理

试验中采用去趋势(De-trending)、标准化(Normalize)、标准归一化(standard normal variate,SNV) 进行光谱预处理,采用PLSR 建立SSC 预测模型。去趋势法所建模型的结果最差,Rp2 和RMSEP分别为0.80 和1.62%,预测能力相对较差。其他3种方法所建模型结果相近,其中Normalize 所建模型的结果稍差,Rp2 和RMSEP 分别为0.86 和0.32%。原始光谱和SNV 所建模型的Rc2、Rp2 和RMSEP 相同,原始光谱所建模型的RMSEC 最小。因此,选择原始光谱信息进行后续分析,基于全波段所建PLSR模型的Rp2 和RMSEP 分别为0.86 和0.31%。

不同预处理方法所建PLSR 模型的预测结果见表2。

表2 不同预处理方法所建PLSR 模型的预测结果

2.2 特征波长提取

为去除冗余信息,针对玉露香梨450~2 475 nm的原始光谱,采用CARS 提取SSC 的特征波长,提取过程如图2 所示。CARS 在特征波长选取中,利用蒙特卡洛交叉验证选取最优潜在变量,设定采样次数为50。图2(a) ~(c) 分别为随采样次数的变化所选取的特征波长个数,RMSECV 随采样次数的变化,采样过程中回归系数的变化。采样中随采样次数的增加,变量数逐渐减小;对模型贡献率大的变量的回归系数被放大和保留,反之被淘汰。由图2可知,在第27 次采样时,RMSECV 达到最小值0.211 4%,共提取到51 个变量。该51 个变量所对应的波长即为特征波长,分别为454,460,461,462,464,473,490,491,495,639,657,676,723,800,840,889,913,914,936,956,977,991,1 142,1 143,1 144,1 249,1 273,1 362,1 421,1 671,1 875,1 878,1 906,1 951,2 013,2 014,2 015,2 041,2 090,2 183,2 213,2 214,2 318,2 339,2 365,2 394,2 410,2 412,2 418,2 472,2 475 nm。

图2 CARS 提取特征波长

CARS 提取特征波长见图2。

由于CARS 提取的特征波长数量较多,进行二次数据降维。因此,采用SPA 算法对CARS 所提取的特征波长进行第二次降维。当变量数为16 个时,RMSE 的变化趋于稳定,RMSE 为0.3421 4%(见图3)。所提取到的16 个特征波长的分布(见图4),图4 中提取的数值需与CARS 提取到的特征波长相对应。根据重要程度提取到的特征波长依次为2 183,2 015,1 875,2 318,639,1 951,657,723,495,889,1 421,460,2 472,1 362,2 475,676 nm。

图3 RMSE 随变量数的变化

图4 SPA 提取特征波长

RMSE 随变量数的变化见图3,SPA 提取特征波长见图4。

2.3 SSC 检测模型的建立

分别将全波长和CARS、CARS-SPA 提取到的特征波长所对应的光谱数据作为模型输入,采用PLSR建立检测模型。

不同波段PLSR 预测结果见表3。

表3 不同波段PLSR 预测结果

由表3 可知,全波段所建模型的Rp2 最高,RMSEP 最低。与全波段所建模型相比,采用CARS提取特征波长所建模型的校正集预测结果明显提高(Rc2 提高0.04,RMSEC 降低0.05%),预测集的结果降低(Rp2 降低0.03,RMSEC 提高0.02%)。CARS 所建模型的校正集和预测集的预测结果差异性最明显。与全波段所建模型相比,CARS-SPA 所建模型的Rc2 降低了0.05,RMSEC 提高了0.07%,Rp2 降低0.03,RMSEC 提高0.03%。与CARS 所建模型相比,CARS-SPA 所建模型的Rc2 降低了0.09,RMSEC 提高了0.12%,Rp2 相同,RMSEC 提高0.01%。3 个模型的预测集结果接近,均得到较好的预测结果(Rp2 为0.83~0.86,RMSEP 为0.31%~0.34%)。与全波段和CARS 所建模型的预测结果相比,CARS-SPA 所建模型的校正集和预测集结果的差异性最小。CARS-SPA 所提取到的变量信息较少,在建模过程中计算的复杂性相对更小、运算速度相对更快。因此,采用CARS-SPA 所建模型实现了玉露香梨SSC 的检测,且得到了较好的预测结果,Rp2和RMSEP 分别为0.83 和0.34%。

3 结论

基于可见/ 近红外光谱技术进行玉露香梨SSC检测。与预处理后所建PLSR 模型的预测结果相比,原始光谱所建PLSR 模型的结果稍好。基于全波段、CARS、CARS-SPA 提取的特征波长所建PLSR 模型均得到好的预测结果,Rp2 为0.83~0.86,RMSEP 为0.31%~0.34%。与全波段和CARS 所建PLSR 模型的预测结果相比,CARS-SPA-PLSR 模型校正集和预测集结果间的差异性最小,且CARS-SPA 所提取到的变量信息最少。因此,CARS-SPA-PLSR 模型得到最优的预测性能,Rp2 和RMSEP 分别为0.83 和0.34%,为实现玉露香梨SSC 在线检测提供了基础。

猜你喜欢
玉露香梨波长
HPLC-PDA双波长法同时测定四季草片中没食子酸和槲皮苷的含量
玉露香梨“赛美人”
寒露感怀
“隰县玉露香梨”品牌建设
冰灯玉露烂根怎么办
转变生产方式,促进库尔勒香梨提质增效
双波长激光治疗慢性牙周炎的疗效观察
香梨:瀚海的果实
日本研发出可完全覆盖可见光波长的LED光源
便携式多用途光波波长测量仪