近红外光谱分析技术在蔬菜品质检测中的应用研究进展

2021-12-10 15:58薛舒丹谢大森万小童刘展舒钟玉娟
广东农业科学 2021年9期
关键词:校正预处理光谱

薛舒丹,谢大森,万小童,陆 森,刘展舒,钟玉娟

(广东省农业科学院蔬菜研究所/广东省蔬菜新技术研究重点实验室,广东 广州 510640)

中共中央、国务院印发的《“健康中国2030”规划纲要》和《国民营养计划(2017-2030年)》指出,要优化食物结构,改善营养状况,发展营养健康食品。蔬菜是人们日常饮食中必不可少的食物之一,可提供人体所必需的多种维生素和矿物质等营养物质。据联合国粮食及农业组织(FAO)统计,人体必需维生素C 的90%、维生素A 的60%来自蔬菜。此外,蔬菜中还有多种多样的化学物质,是人们公认的对健康有效的成分。

蔬菜是人们膳食结构金字塔中的基础物质,其产业在国民经济中占有重要地位。现今消费需求呈多元化、差异化,人们注重蔬菜质量安全的前提下,更加注重蔬菜品质,追求风味优、营养丰富的蔬菜品种。但蔬菜同质化、规模化和集约化种植模式导致蔬菜瓜果丢失了传统的味道,如番茄不甜、韭菜不呛,这与一些地方优势老品种被新品种逐步替代所致。因此,收集优质种质资源,加强优质蔬菜育种成为提升蔬菜产业竞争力的核心内容,已成为世界各国农业科技创新驱动战略的重要组成部分。

蔬菜品质涉及多方面内容,在蔬菜安全的前提下(无农药残留等),蔬菜内在质构(硬度、水分、粗纤维等)、风味(甜、酸、苦、辣滋味特征)、营养健康成分(维生素C、硫代葡萄糖苷、叶黄素、胡萝卜素、番茄红素等)均影响蔬菜品质。然而传统的蔬菜质检过程耗时久、成本高,无法满足蔬菜快速检测的要求。而采用近红外光谱(Near Infrared Reflectance Spectroscopy,NIRS)分析技术可以对一些果蔬内部或外部质量参数进行准确、快速的测量。近红外光谱分析技术综合运用了计算机技术、光谱技术和化学计量学等多个学科的交叉研究成果,被许多科学家认为是21 世纪快速、实时分析和过程控制的先导技术,它以其独特的优点在多个领域特别是农业领域得到广泛应用,是一种高效、绿色的分析测试技术,其光谱特性稳定、信息量大,能够反映样品的综合信息,并可通过多元校正模型实现多组分同时测定[1-2]。本文综述了近红外光谱技术原理及在蔬菜安全、食味好、健康等多方面优质特征指标检测中的应用,以期为蔬菜全产业链的高效发展提供新思路,加速种养规范化、育种高效化进程。

1 近红外光谱技术

近红外光谱是指波长介于可见区与中红外区之间,波长范围780~2 526 nm、频率12 500~4 000 cm-1的电磁波。近红外光谱法是根据样品内有机官能团(O-H、C-H、N-H、P-H)的自身振动吸收近红外光谱区相应波长的能量,从而产生能量跃迁并在光谱中表现出来,该法图谱稳定、且获得光谱容易[3]。近红外光谱技术是将近红外光谱仪、化学计量学软件以及应用模型三者合并应用的技术[4]。首先采集样品的光谱数据,然后结合化学计量学方法对组分定性定量,最后将光谱与数值建立数学模型,利用数学模型即可定量预测各组分的浓度和性质。

1.1 近红外光谱预处理

由于在近红外光谱中通常掺杂了样品背景、杂散光以及电噪音等各种杂音和不相干的信息,因此需要采用合适的方法适度处理光谱。Savitzky-Golay 卷积平滑、标准正态变量变换(SNV)、去散射(Detrend)、一阶导数(FD)及 二阶导数(SD)、傅里叶变换、多元散射校正(MSC)、小波变换(WT)等光谱预处理方法使用较为普遍,可将谱图信息处理得更清晰[5-6]。

1.2 化学计量学软件应用

现代近红外光谱分析技术定量校正分析可采用偏最小二乘回归法(Partial Least Squares Regression,PLS)、主成分回归分析法(Principal Component Regression,PCR)、多元线性回归法(Multiple Linear Regression,MLR)、人工神经 网 络 法(Artificial Neural Network,ANN);常用的定性分析方法有聚类分析法(Cluster Analysis)、主成分分析法(Principal Component Analysis,PCA)、马氏距离法(Mahalanobis)、马氏距离法与主成分分析结合法等[7-9]。

1.3 近红外光谱定标模型评价

数学模型的内部交叉验证决定系数(R2)、内部交叉验证均方差(RMSECV)、校正均方差(RMSEC)、预测均方差(RMSEP)、预测相关系数(r2)作为近红外光谱模型精度评价指标。其中R2越接近1,表示分析模型对校正集预测越准确;RMSEC值越小,表示所建模型对校正集预测效果越好;RMSECV值越小,表示校正集样品的预测结果越接近参考值;RMSEP越小,表示验证集样品的预测结果越接近参考值;r2越接近1,表示分析模型对验证集预测越准确。

近红外光谱分析技术本质上属于一种间接分析法,通常以校正策略来建立起各种未知样本的定性分析与定量分析模型,这明显不同于其他常规分析方法。与化学法或物理化学法相比,该法样品制备简单、测定快速环保,可同时高效完成多个样品不同化学指标的检测,可实现在线分析和远程分析[10]。

2 近红外光谱技术在蔬菜安全品质检测中的应用

2.1 蔬菜内源不安全因素的近红外光谱检测

蔬菜在生长发育过程中会吸收硝态氮,硝酸盐类在蔬菜加工处理中会被还原成亚硝酸盐。亚硝酸盐使红血球运输氧的能力减弱,进而危害人体健康,亚硝酸盐在酸性条件下还会转化成致癌物质亚硝酸铵,因此对于蔬菜加工内源物质亚硝酸盐含量的检测至关重要。通常亚硝酸盐含量测定需要采用化学法或离子色谱法,前处理复杂,需对蔬菜进行破坏性处理。但刘金阳等[11]利用近红外光谱技术开展了榨菜中亚硝酸盐含量的检测,结果表明采用偏最小二乘法的亚硝酸盐组分模型预测能力优良、分析速度快、高效准确。

2.2 蔬菜外源农药残留的近红外光谱检测

近红外光谱技术对现今农药残留的定性分类鉴别准确性很高。李敏[12]对小白菜进行农药残留鉴别,结果表明对含轻度和重度残留农药样本的正确鉴别率为90%,可以有效对小白菜的残留农药进行定性分类鉴别。Sánchez 等[13]利用近红外光谱技术对辣椒中是否存在农药残留进行检测,建立偏最小二乘判别分析模型,实现农药残留快速无损的定性鉴别。Jamshidi 等[14]分析了不同浓度二嗪农残留黄瓜样品的可见/近红外光谱,并用化学计量检测作参考值,建立基于光谱信息的偏最小二乘分类模型,实现判定黄瓜有无二嗪农残留的快速无损检测。

近红外光谱技术在蔬菜特定农药残留的定量方面也有很多应用。杜一平等[15]利用近红外光谱技术实现辣椒粉有无掺杂苏丹红的鉴别,并结合液相化学结果建立了预测辣椒粉中掺入苏丹红含量的模型。刘翠玲等[16]针对菠菜中的毒死蜱残留量进行近红外光谱模型建立,采用一阶导数与矢量归一化相结合的光谱预处理方法,利用PLS方法开发了预测值与化学值相关性好的模型。吴泽鑫等[17]针对番茄乐果农药残留采用近红外光谱技术,通过矢量归一化光谱预处理方式,所建立的判别番茄中乐果残留的BP 人工神经网络模型为最优,相关性达到0.971。Bahareh 等[18]基于Vis/NIR 光谱以及化学计量学方法设计相应系统软件,可对黄瓜进行快速和非破坏性检测不同浓度的二嗪磷残留,也可推广应用到农产品其他农药残留的检测。

品质安全是蔬菜产业的基本问题。近红外光谱技术高效便捷,提升了蔬菜安全管控的效率。但一些关乎蔬菜产品安全的物质是微量的,目前采用近红外光谱分析技术检测微量甚至痕量水平物质的精度仍有待提高。相关研究需要从样品前处理、光谱预处理以及不同的化学计量学方法入手,以建立更精准的数学模型来达到更高的检测灵敏度。

3 近红外光谱技术在蔬菜内在质构检测中的应用

蔬菜内在质构研究主要围绕含水量、硬度、淀粉含量、粗纤维含量等指标开展,对蔬菜品质研究意义重大。Huang 等[19]用声学、冲击、压缩和穿刺试验测量了番茄的不同硬度参数,在900~1 700 nm 近红外光谱区段,利用PLS 方法建立番茄果实的硬度模型,PLS 模型对番茄果实的冲击强度、压缩面积和刺穿斜率有更好的预测,相关系数分别为0.846、0.831 和0.853。Sirisomboon 等[20]基于近红外光谱技术测定番茄质地,在1 100~1 800 nm 波长范围内,通过MSC预处理光谱,采用PLS 方法建立模型,经穿刺试验测得生物屈服力相关系数为0.95,最低预测标准误差SEP为0.35 N,偏差为0.19 N。Shao 等[21]对200 个番茄样品的果实硬度进行可见光和近红外反射光谱(Vis/NIRS)模型预测,在350~2 500 nm 波长范围内利用PCR 和PLS 方法建立良好模型,相关系数和标准误差分别为0.81 和16.017 N。Clément 等[22]使用Vis/NIRS 反射光谱法和化学计量学以无损方式测量番茄硬度,此近红外光谱模型的相关系数为0.75。Kavdir 等[23]用近红外光谱分析技术,在800~1 650 nm 波长范围内,采用PLS 方法建立酸黄瓜的硬度、干物质含量模型,结果酸最优PLS 校正模型的决定系数R2分别为0.70、0.65。张拥军等[24]对莲藕的近红外光谱经一阶导数和二阶导数预处理,建立了水分、粗纤维、质构的PLS 模型,其中硬度PLS 模型最理想,相关系数大于0.97;粗纤维和水分PLS 模型的相关系数均大于0.88。宋夏钦等[25]采用傅里叶变化近红外光谱技术,选取4 000~8 500 cm-1为分析区域,采用PLS 方法建立雷竹笋的硬度和水分含量快速检测方法。周竹等[26]研究了雷竹笋硬度光谱检测模型的优化方法,采用bi PLS-CARSSPA 方法所选的特征变量避免了水分强吸收峰的影响,为竹笋硬度在线快速检测、筛选和指导切削设备的研发提供了重要的理论依据。涂静等[27]利用近红外光谱技术对莲藕淀粉含量进行无损检测,原始光谱数据采用多元散射校正、一阶导数和平滑等结合的预处理效果最佳,结合PLS 和联合区间偏最小二乘法(SiPLS)建立了莲藕淀粉含量的近红外光谱分析模型。Flores-Rojas 等[28]采用近红外光谱评估绿芦笋的质地参数,最大剪切力及切割能的相关系数分别为0.55~0.67、0.60~0.74。Penchaiya 等[29]采用近红外反射光谱技术,在780~1 690 nm 波长范围内,利用PLS 方法建立甜椒果实硬度模型,相关系数及交叉验证标准误差分别为0.81、5.9。

综上可见,近红外光谱技术所呈现出来的光谱吸收可以很好地反映蔬菜质构组成决定因子如水分、纤维素和果胶等物质的含量,进而直接影响蔬菜自身的机械强度以及口感等,这对于聚焦筛选质构优异资源及品种提供快速简单方法意义重大。

4 近红外光谱技术在蔬菜风味检测中的应用

4.1 甜滋味的近红外光谱检测

李鸿强等[30]建立了结球甘蓝可溶性糖的全谱PLS 模型,并根据竞争性自适应重加权采样法(CARS)波数优选结果建立了结球甘蓝可溶性糖的CARS-PLS 模型。该CARS-PLS 模型校正集的决定系数R2为0.96,RMSECV为0.0768%,RMSEP为0.0594%。应用CARS-PLS 模型对验证集41个样本进行预测,预测集决定系数R2为0.86,预测标准误差为0.0594%,研究结果提供了一种高效的结球甘蓝质量无损检测方法。Zude 等[31]使用近红外光谱反射技术对胡萝卜的蔗糖、葡萄糖和果糖含量进行无损伤检测,在800~1 700 nm波长范围内利用PLS 方法建立了蔗糖、葡萄糖和蔗糖的预测模型,交叉验证的标准误差(SECV)分别为15.4%、4.6%和2.3%。Jantra 等[32]基于可见光和近红外光谱的无损检测方法,建立了用于检测洋葱和大蒜可溶性固形物含量的模型。Rady 等[33]使用近红外光谱反射技术,在900~1 685 nm 波长范围内利用PLS 方法建立了葡萄糖和蔗糖的预测模型,决定系数R2为0.82。孙旭东等[34]基于近红外光谱以及最小二乘支持向量机LSSVM 算法,建立了检测马铃薯全粉还原糖含量的模型。马兰等[35]发现常数偏移消除光谱预处理是适合建立近红外光谱无损检测番茄可溶性固形物含量PLS 模型的最优光谱预处理方法,最能反映番茄可溶性固形物含量信息的光谱波段为11 998.9~5 449.8 cm-1和4 601.3~4 246.5 cm-1。刘燕德等[36]为了消除近红外光谱中无关信息和噪音的影响,比较了7 种光谱预处理方法的优化效果,建立了检测辣椒可溶性固形物含量的最优模型,所对应的预处理方法为1st D+MSC,其校正集R2为0.994、RMSEC为0.119°Brix、验证集为0.956、RMSEP为0.309°Brix。

4.2 酸滋味的近红外光谱检测

Shao 等[21]对番茄样品的pH 进行Vis/NIRS模型预测,在350~2 500 nm 波长范围内利用PCR和PLS 方法建立较好模型,相关系数和标准误差分别为0.83 和0.09。Jha 等[37]应用便携式近红外设备采集西红柿汁的光谱,消费者对番茄汁的接受程度取决于番茄汁的酸甜比(ABR),在1 059.5~1 124.8 nm 波长范围内,ABR 的相关系数高达0.92。Clément 等[22]使用Vis-NIR 反射光谱法和化学计量学以无损方式同时测量番茄的各种质量参数,其中pH 值、可滴定酸度的预测不太准确,可能是因为这些参数在样品中的多态性较低,范围较窄所致。Flores 等[38]对番茄的可滴定酸度建立近红外光谱模型,决定系数为0.41~0.71。

4.3 苦滋味的近红外光谱检测

蔬菜中含有苦味的物种不多,如苦菊、苦瓜以及葫芦科部分黄瓜属等,目前关于苦味物质的近红外光谱预测方法建立还较少。François 等[39]发现菊苣的苦味主要由莴苣苦素和山莴苣苦素决定,通过近红外光谱建立预测模型,得到苦涩口感的RMSECV为0.26,这为苦味育种表型的鉴定提供便捷方法。但是关于苦瓜、黄瓜中苦味物质的近红外光谱研究尚无报道。

4.4 辣滋味的近红外光谱检测

董楠等[40]以干辣椒为对象,采用近红外快速测定方法检测其辣度。利用PLS 方法建立检测模型,并对检测波长范围及模型主因子数进行了筛选,最终校正集方程相关系数0.9871,验证集方程相关系数0.8704;校正均方根误差2 870,交叉验证均方根误差9 476,主因子数为8。李沿飞等[41]利用近红外光谱技术,选取光谱波段9 000~4 000 cm-1,采用PLS 方法无损测定干辣椒的辣椒碱和二氢辣椒碱含量来评价其辣度。

综上可见,在不同的蔬菜风味物质建模过程中会筛选体现样品信息突出的光谱区域,采用光谱预处理削弱甚至消除谱图所受到的各种外界因素干扰,以及采取不同的化学计量学方法,都是为了促进模型准确性提升。但是有些模型的决定系数不高,可能与最原始的风味物质化学值测定准确性以及样本数据量太少有关,也可能与仪器周围环境(如温度、湿度等)变化或光学器件磨损老化等导致光谱差异有关。随着科学技术的不断发展,近红外光谱技术将以其快速、方便、准确以及适应在线分析和无损分析的优点,在快速精准检测蔬菜风味物质以及蔬菜风味育种中具有更加广阔的应用前景。

5 近红外光谱技术在蔬菜营养健康成分检测中的应用

5.1 维生素C 的近红外检测

金同铭等[42]用近红外光谱法对不同品种、不同成熟期大白菜的Vc 含量进行模型构建,相关系数R2为0.981,可高效运用于实践。刘燕德等[36]为消除近红外光谱中无关信息和噪音的影响,比较7 种光谱预处理方法的优化效果,确定辣椒最优Vc 模型所对应的预处理方法为SNV,其校正集R2为0.949、RMSEC为106.96 mg/kg,验证集为0.812、RMSEP为201.89 mg/kg。Kramchote 等[43]选取500~1 000 nm 波长范围,使用一阶和二阶导数对谱图进行预处理,利用PLS方法建立了甘蓝Vc 的近红外光谱检测模型。郭泽慧[44]采用一阶导数光谱预处理结合PLS、PCR回归方法对萝卜根、叶中的硫苷含量建立模型。

5.2 硫代葡萄糖苷的近红外检测

Sahamishirazi 等[45]采用改进的偏最小二乘回归法对花椰菜的硫代葡萄糖苷含量进行近红外光谱建模。刘倩男等[46]建立了青花菜硫代葡萄糖苷内4-甲基硫氧丁基硫苷(RAA)和3-甲基吲哚基硫苷(GBC)的近红外光谱快速检测模型,采用标准正态变量变换+二阶导数(SNV+SD)处理后RAA 预测模型的校正集和预测集相关系数分别为0.867 和0.912;采用SNV+SD 处理后的GBC 预测模型的校正集和预测集相关系数分别为0.918 和0.960,为青花菜营养品质的快速检测、优异抗癌青花菜种质资源的快速筛选与利用奠定了基础。

5.3 类胡萝卜素的近红外检测

类胡萝卜素是重要的天然色素,是人体内维生素A 的主要供体,具有抗氧化、抗癌、抗衰老以及调节免疫功能等功效。迄今,已知的天然类胡萝卜素达700 多种,常见的有叶黄素、β-胡萝卜素、番茄红素等。Chen 等[47]使用PLS 方法建立了芥蓝中叶黄素和β-胡萝卜素的模型,校正方程R2分别为0.983 和0.982。潘冰燕等[48]采用改进最小偏二乘法(MPLS),研究光谱不同导数处理方法结合不同散射和标准化方法处理模型的方法,从而找出最优货架期线椒内部品质类胡萝卜素的数学模型。Clément 等[22]使用VIS-NIRS反射光谱法和化学计量学以无损方式测量番茄的番茄红素含量,决定系数R2为0.98,RMSECV为3.15 mg/kg。王凡等[49]基于VIS-NIRS 检测系统,采集完整番茄的透射光谱进行建模,对光谱进行SNV 预处理,采用无信息变量消除法(UVE)和竞争性自适应重加权算法(CARS)联合处理,对全光谱进行变量优选,使用PLS 方法,其校正集和验证集相关系数分别为0.9830 和0.9741,均方根误差分别为0.6919、0.7680 mg/kg。

蔬菜中决定风味及营养的物质成分丰富多样,尤其是次生代谢物质,但普遍的次生代谢物质成分含量均较低。对于这些成分指标的化学定量法均需依赖HPLC 或MS 级别的仪器,而很多实验室不具备化学定量的条件,这阻碍了基于近红外光谱及化学测量值结合的模型构建,而且对于这些低含量次生代谢物质构建的近红外光谱模型普遍的预测决定系数R2不是特别高,今后需在光谱的预处理方式、消除信噪比、化学计量方式等方面进行综合处理解决。

6 趋势与展望

随着社会进步和生活水平的提高,市场对蔬菜的要求已从单纯注重产量和抗性,提升到注重品质。现今,蔬菜安全是基本要求,口感优良、营养丰富已成为越来越多消费者的选购标准。品质成为蔬菜产业竞争力的核心内容,营养和风味优良的高档蔬菜是发展趋势。蔬菜风味佳最直观的食用感受就是菜味浓郁,酸、甜、苦、辣等不同滋味是蔬菜风味的主要影响因素。但当前消费者普偏反映菜没有“菜味”,风味营养品质随着产量和抗性增强而下降。我国蔬菜品质育种仍处于起步阶段,蔬菜品质与国际先进水平尚有差距,而且支撑品质改良的专业研究机构及高效快捷鉴别风味营养的方法也很缺乏。传统的蔬菜品质评定基于大小、色泽、形状及伤痕等外部特征来判断,或者采用化学法、液相色谱法以及质谱检测法等破坏性方式评估其风味营养成分,耗时久、成本高。随着计算机信息化、数学、化学和化学计量学的交叉发展,近红外光谱技术已经在蔬菜品质研究中被逐步推广应用。近红外光谱技术一方面可监督种植端种植规范化,另一方面可帮助育种工作者加速蔬菜内在品质研究的进度。

但是近红外光谱技术在蔬菜品质方面的应用依然任重道远。由于蔬菜优质是一个复杂概念,其中涉及到好吃、健康等多重宏观指标,而关乎“好吃”的标准又与质地、风味等因素相关。决定质地及蔬菜风味的物质复杂多样,甚至有的蔬菜关键指征风味物质成分都还未得到鉴定。因此挖掘蔬菜优质因子,分析其成分是开展近红外光谱技术的基础,这需要很多不同方向的科研工作者共同努力。

此外,近红外光谱技术虽然有很多优势,但也有一些限制和不足,如只适合于含氢基团化合物的测定,以及对一些痕量物质的检测灵敏度较低等。而且这是一种间接测量方法,构建模型需要大量的样品测定值以及化学计量学理论知识。因此稳定高效的近红外光谱模型的建立是近红外光谱分析技术应用的关键。其中化学测定值是建立健全近红外光谱定标模型的核心参数,从高质量的定标模型构建角度来看,参数的准确性对模型尤为重要,另外建模方法、光谱预处理方法、波段选择和建模因子数选择等化学计量学方法也是影响模型精准度的关键因子。随着现代计算机技术和化学计量学技术的发展以及新的卓越的数学方法的出现,模型将进一步完善,促使近红外光谱技术在蔬菜领域中得以充分应用。

猜你喜欢
校正预处理光谱
基于三维Saab变换的高光谱图像压缩方法
KR预处理工艺参数对脱硫剂分散行为的影响
求解奇异线性系统的右预处理MINRES 方法
基于3D-CNN的高光谱遥感图像分类算法
粉末预处理对钨坩埚应用性能的影响
污泥预处理及其在硅酸盐制品中的运用
劉光第《南旋記》校正
基于特征分解的方位向多通道SAR相位失配校正方法
空间相机次镜在轨校正仿真分析
一种具有自动校正装置的陶瓷切边机