基于CARS-SPA的苹果可溶性固形物可见/近红外光谱在线检测

2014-03-07 05:53许文丽药林桃刘木华
食品工业科技 2014年22期
关键词:可溶性预处理光谱

许文丽,药林桃,孙 通,胡 田,胡 涛,刘木华,*

(1.江西农业大学生物光电技术及应用重点实验室,江西南昌 330045;2.江西省农业科学院农业工程研究所,江西南昌 330200)

基于CARS-SPA的苹果可溶性固形物可见/近红外光谱在线检测

许文丽1,药林桃2,孙 通1,胡 田1,胡 涛1,刘木华1,*

(1.江西农业大学生物光电技术及应用重点实验室,江西南昌 330045;2.江西省农业科学院农业工程研究所,江西南昌 330200)

采用CARS(competitive adaptive reweighted sampling)联合连续投影算法(SPA)方法筛选苹果可见/近红外光谱的特征变量,继而联合多种不同建模方法建立苹果可溶性固形物(SSC)预测模型,并对预测模型进行对比研究。研究结果显示,采用CARS-SPA联合筛选出的31个变量,通过采用PLS建立苹果SSC的可见/近红外光谱在线检测模型性能最稳定,其变量数仅为原始光谱的1.69%,预测集的相关系数和均方根误差分别为0.936和0.351%。研究表明采用CARS-SPA能有效提取苹果SSC的光谱特征变量,能有效简化模型并提高模型精度。

可见/近红外光谱,苹果,CARS-SPA,PLS,可溶性固形物

苹果乃世界四大水果之一,我国目前苹果总产量位居世界前茅,但出口量很少且国内高端苹果市场多被国外进口苹果所占领,为改善这一状况,则需针对苹果的内在品质进行检测,实行在线分级,以提升我国苹果在国内外市场中的竞争力。本文选择对水果口感的具有极大影响的水果可溶性固形物作为水果内部品质研究对象。

近年来,大量研究将可见/近红外光谱技术应用于水果内部品质的检测[1-8]。目前国内外学者利用可见/近红外光谱技术对苹果的内部品质做了一些研究。欧阳爱国等[9]对光谱范围为482.2~1009.5nm的苹果可溶性固形物光谱,采用三种方法筛选光谱变量,然后结合偏最小二乘法建立苹果SSC的近红外光谱检测模型,结果显示GA-PLS方法能够提高苹果SSC模 型 精 度 。Jha等[10]采 集900~1700nm范 围 内 的 苹 果近红外光谱,对比不同波段、不同预处理方法以及不同建模方法所建立的苹果可溶性固形物、酸度和糖酸比模型结果可知,多元线性回归所建立模型效果较好,对于苹果可溶性固形物和酸度来说采用多元散射预处理方法效果最佳,而糖酸比未经预处理效果最优。此外其他学者也对苹果的内部品质进行了研究[11-17]。

本研究采用多种预处理方法对苹果SSC的可见/近红外光谱在线检测光谱进行处理,继而联合CARS(competitive adaptive reweighted sampling)与 SPA(successive projections algorithm)对苹果SSC的可见/近红外光谱在线检测光谱变量进行筛选,而后联合多种建模方法建立苹果SSC在线回归模型,进行对比研究,用以考察CARS-SPA对苹果SSC在线回归模型的影响。

1 材料与方法

1.1 材料与仪器

苹果 本实验所选样品为购自于南昌水果批发市场的一批苹果。实验进行前挑选200个表面没有缺陷或碰伤的苹果,将其表皮擦拭清理干净,于果柄附近编号,继而对样品进行外观数据测量,将样品置于室温下保存12h,使其温度与室温基本一致。实验一共采用200个苹果样品,将实际测得的可溶性固形物值中最大值和最小值的样品直接作为建模集,继而按3∶1比例随机分配建模集和预测集,150个样品作为建模集用于建立苹果SSC预测模型,50个样品作为预测集用于评价苹果SSC预测模型的性能。

苹果可见/近红外光谱在线检测系统 见图1,实验采用的光谱仪为美国海洋光学公司的USB4000微型光纤光谱仪(Ocean Optics,USA),CCD检测器,其波长范围为465~1150nm;光源为2个15V/150W的卤钨灯,光纤为海洋光学的Qp600-2-VIS-NIR;折射仪 为 PR101 手 持 式 折 射 仪(Atago Co.,Ltd.,Tokyo,Japan),参比为一个是直径为80mm的聚四氟乙烯球;对射型光电传感器 沪工牌。

图1 苹果近红外光谱检测系统Fig.1 Schematic diagram of the setup for NIR measurement of apple

1.2 光谱采集

光谱数据采集前先将该装置预热30min以至系统性能稳定,承载水果的机械传送系统以0.3m/s的速度运行,光谱仪外部触发由光电传感器控制,采用VC6.0编写的软件采集和存储光谱,采集样品光谱前,先采集参比和暗电流光谱,样品放置于传送系统的托盘上,控制每个样品于苹果赤道部位按120°旋转间隔采集3次光谱,光谱由软件直接换算成吸光度保存,继而将吸光度光谱用于后续数据处理。

1.3 苹果SSC的测定

苹果可溶性固形物按照国标GB 12295-90的方法测定,先将苹果样品去皮、切片以及剔核,继而将切片的果肉部分放入压汁机进行压榨,将汁液用滤纸过滤后滴于数字式折射仪的测试窗口上测量其SSC含量,取连续重复测得两次相同值作为苹果样品SSC含量的实际测量值。

1.4 数据处理分析

1.4.1 数据预处理方法 采用不同预处理方法结合PLS建立苹果SSC的预测模型,对比不同的预处理方法对模型性能的影响。本实验对苹果漫透射光谱采用 了 标 准 正 交 变 量 变 换(Standard Normal Variate,SNV)、多 元 散 射 校 正(Multiplicative Scattering Correction,MSC)、基线校正(Baseline)、正交信号校正法(Orthogonal Signal Correction,OSC)、解趋势(Detrending)等预处理。

1.4.2 CARS-SPA数据特征变量优选 可见/近红外本身数据量相当庞大,为了挑选出有效的光谱数据特征变量,简化模型,本文采用了CARS联合SPA用于挑选出光谱数据的特征变量。采用CARS对苹果可见/近红外光谱数据进行变量优选,设置其蒙特卡罗(MC)采样次数为50次,所选择的波长变量子集采用10折PLS交叉验证建模,通过RMSEC值最小确定最优的变量子集本研究采用,继而采用SPA对经CARS挑选出的变量子集进行二次挑选,以期获得更少的特征变量,建立性能更加简单、稳定的模型。

数 据 处 理 分 析 由 化 学 计 量 学 软 件 The Unscrambler x 10.1 (CAMO AS,Trondheim,Norway)和Matlab 7.11(The Math Works,Inc,USA)实现。

选择均方根误差以及相关系数作为本研究评价模型性能的标准。模型的相关系数值越高,均方根误差值越小,则模型的预测能力则越强。

2 结果与讨论

2.1 苹果可溶性固形物值统计结果

200个苹果总样本集以及经随机挑选后分集统计所得出的建模集、预测集的样本数量、可溶性固形物变化范围、平均值以及标准差如表1所示,所有样本、建模集和预测集样本的SSC的平均值、标准偏差及范围均较为接近,且建模集的SSC范围略大于预测集,由此可知苹果建模集所建立的模型能很好的适用于预测集样品。

表1 苹果可溶性固形物的统计结果Table 1 The statistical results of soluble solids content of apple

2.2 苹果可见/近红外光谱分析

本实验光谱仪的检测范围为465~1150nm,共计3648个样本变量点,采用如此庞大的数据进行计算,不仅计算量大,而且因样品部分区域的光谱信息与样品SSC成分关联性极弱,而光谱数据两端因靠近检测器检测极限两端时会存在一些噪声,故此本文剔除两端光谱信息,选取600~950nm,共计1832个变量数作为后续处理数据。图2为600~950nm范围内200个苹果样品的可见/近红外光谱图,可见该波段范围内存在较多波峰波谷,所含信息量丰富,适合用于建立同苹果SSC的预测模型。

图2 苹果样本的可见/近红外光谱Fig.2 Vis/NIR spectra of all apple samples

2.3 预处理方法比较

对波段范围为600~950nm样本的透射光谱采用不同预处理结合PLS建模结果如表2所示,由表2可知,SNV、MSC、Baseline以及De-trending并不适合用于本数据预处理,所建立的模型性能均不如原始光谱所建立的PLS模型,而OSC与原始PLS模型性能相差无几,并无明显改善,因此对比多种预处理方法结合PLS建模结果得知,选用原始光谱用作后续数据处理更为合适。

表2 不同预处理方法的模型结果Table 2 The model results of different pretreatment methods

2.4 CARS-SPA

采用CARS对苹果可见/近红外光谱数据进行变量优选,经CARS挑选出的包含113个特征变量,将113个特征变量经SPA二次挑选出31个特征变量,同1832个原始变量数相比,仅占1.69%。CARS和CARSSPA联合PLS分别建立苹果可溶性固形物模型,其结果如表3显示,CARS-PLS与CARS-SPA-PLS同原始的PLS模型相比,建模性能都略显不足,但利用预测集对模型进行预测,预测效果却有较大提升。由表3可知,CARS-SPA-PLS比CARS-PLS和原始PLS,不仅变量数目极大减少了而且模型性能也更加稳定,因此本研究确定CARS-SPA为本文的变量优选方法。

表3 不同变量优选方法的苹果可溶性固形物结果Table 3 Results of SSC of apple using different varaibles select methods

2.5 不同建模方法比较

表4为CARS-PCA联合不同建模方法所得出的模型性能结果。本研究对比了PLS、PCA、MLR、LSSVM四种建模方法用于建立苹果的可溶性固形物模型,由表4可知,PCA建模效果最差,LS-SVM模型效果略好些,PLS与MLR模型效果较好。判断模型优劣时,不单要求相关系数高、均方根误差小,并且要求建模均方根误差同预测均方根误差间差值也小,故本研究选择CARS-SPA-PLS作为最佳模型,采用50个预测集样本对该模型进行预测所得关系如图3所示,回归线表达式为y=0.8248x+2.1673。

表4 不同建模方法的苹果可溶性固形物结果Table 4 Results of SSC of apple using different modeling methods

图3 苹果预测集样本的可溶性固形物预测结果Fig.3 Predicted results of SSC of apple in prediction set

3 结论

本文采用可见/近红外光谱联合CARS-SPA变量优选对苹果的SSC进行快速无损在线检测研究。CARS-SPA联合PLS所建立的苹果SSC预测模型性能最优。与全光谱PLS预测模型相比,建模变量数从1832个下降到31个,预测集的相关系数由0.837上升到0.936,均方根误差由0.541%下降为0.351%。研究结果显示,CARS-SPA方法能有效应用于苹果SSC的在线可见/近红外光谱变量筛选,能降低建模变量数,简化预测模型,提高预测模型的稳定性。

[1]Camps C,Christen D.Non-destructive assessment of apricotfruit quality by portable visible-near infrared spectroscopy[J]. LWT-Food Science and Technology,2009,42(6):1125-1131.

[2]Paz P,Sánchez M T,Pérez-Marín D,et al.Instantaneous quantitative and qualitative assessment of pear quality using near infrared spectroscopy[J].Computers and Electronics in Agriculture,2009,69(1):24-32.

[3]Jha S N ,Jaiswal P ,Narsaiah K ,et al.Non-destructive prediction of sweetness of intact mango using near infrared spectroscopy[J].Scientia Horticulturae,2012,138:171-175.

[4]王加华,戚淑叶,汤智辉,等.便携式近红外光谱仪的苹果糖度模型温度修正[J]. 光谱学与光谱分析,2012,32(5):1431-1434.

[5]Moghimi A,Aghkhani M H,Sazgarnia A,et al.Vis/NIR spectroscopy and chemometrics for the prediction of soluble solids content and acidity(pH) of kiwifruit[J].Biosystems Engineering,2010,106(3):295-302.

[6]韩东海,常冬,宋曙辉,等.小型西瓜品质近红外无损检测的光谱信息采集[J]. 农业机械学报,2013,44(7):174-178.

[7]代芬,蔡博昆,洪添胜,等.漫透射法无损检测荔枝可溶性固形物[J]. 农业工程学报,2012,28(15):287-292.

[8]朱伟兴,江辉,陈全胜,等.梨可溶性固形物含量NIR与变量筛选无损检测[J]. 农业机械学报,2010,41(10):129-133.

[9]欧阳爱国,谢小强,周延睿,等.苹果可溶性固形物近红外光谱检测的偏最小二乘回归变量筛选研究[J]. 光谱学与光谱分析,2012,32(10):2680-2684.

[10]Jha S N,Garg R.Non-destructive prediction of quality of intact apple using near infrared spectroscopy[J].Journal of Food Science and Technology,2010,47(2):207-213.

[11]孙炳新,匡立学,徐方旭,等.苹果有效酸度的近红外无损检测研究[J]. 食品工业科技,2013,34(15):298-301.

[12]孙炳新,匡立学,徐方旭,等.苹果脆度的近红外无损检测[J]. 食品与发酵工业,2013,39(5):185-189.

[13]袁雷明,高海宁,吕松,等.可见/近红外光谱半透射法检测苹果中可溶性固形物含量[J]. 食品安全质量检测学报,2012,3(5):448-452.

[14]高珏,王从庆.基于 KPCA苹果近红外光谱的特征提取研究[J]. 食品科技,2012(3):275-278.

[15]周林峰,吕进,刘辉军,等.温度对果糖含量近红外光谱检测模型传递的影响[J]. 中国计量学院学报,2012,23(3):217-221.

[16]孙旭东,郝勇,刘燕德. 苹果可溶性固形物近红外光谱在线检测影响因素研究[J]. 中国农机化学报,2013(1):86-90.

[17]王加华,戚淑叶,汤智辉,等.便携式近红外光谱仪的苹果糖度模型温度修正[J]. 光谱学与光谱分析,2012,32(5):1431-1434.

CARS-SPA baesd Visble/near Infraed spectroscopy on-line detection of apple soluble solids content

XU Wen-li1,YAO Lin-tao2,SUN Tong1,HU Tian1,HU Tao1,LIU Mu-hua1,*
(1.Optics-Electronics Application of Biomaterials Lab,Jiangxi Agricultural University,Nanchang 330045,China;2.Institute of Agricultural Engineering,Jiangxi Academy of Agricuhural Sciences,Nanchang 330200,China)

CARS was combined with SPA to select the important variables from the visible/near infrared spectrum of apple , then a variety of different modeling methods was used to develop calibration models for SSC of apple , finally , some comparative studies was done among those models.The analysis results showed that 31 variables which selected by CARS-SPA and PLS could build the most stable on-line detection model of apple soluble solids solids (SSC ) ,in this prediction model,the number of variables was only 1.69 percent of the orginal spectrum , the correlation coefficient of prediction and root mean square error of prediction were 0.936,0.351%repectively.This study showed CARS-SPA could effectively extract important variables from spectrum of apple SSC , also it could simplify and improve the accuracy of prediction model effectively.

visible/near-infrared spectroscopy;apple;CARS-SPA;PLS;SSC

TS255.1

A

1002-0306(2014)22-0061-04

10.13386/j.issn1002-0306.2014.22.004

2014-02-28

许文丽(1990-),女,硕士研究生,研究方向:农产品无损检测。

* 通讯作者:刘木华(1969-),男,博士,教授,研究方向:农产品光学检测研究。

国家自然科学基金项目(31271612);留学人员科技活动项目(2012);江西省教育厅科学研究基金(GJJ13254)。

猜你喜欢
可溶性预处理光谱
基于三维Saab变换的高光谱图像压缩方法
鲜地龙可溶性蛋白不同提取方法的比较
基于预处理MUSIC算法的分布式阵列DOA估计
浅谈PLC在预处理生产线自动化改造中的应用
星载近红外高光谱CO2遥感进展
络合萃取法预处理H酸废水
可溶性Jagged1对大鼠静脉桥狭窄的抑制作用
可溶性ST2及NT-proBNP在心力衰竭中的变化和临床意义
基于自适应预处理的改进CPF-GMRES算法
血清可溶性ST2与血BNP在心力衰竭患者中的相关性研究