中宁枸杞品种的近红外光谱快速鉴别

2023-11-08 06:11龙若兰李朵李佩佩胡娜冯丹孙菁
食品与发酵工业 2023年20期
关键词:积分球枸杞光纤

龙若兰,李朵,李佩佩,胡娜,冯丹,孙菁*

1(中国科学院西北高原生物研究所 青海省青藏高原特色生物资源研究重点实验室,青海 西宁,810008) 2(中国科学院西北高原生物研究所 中国科学院藏药研究重点实验室,青海 西宁,810008) 3(中国科学院大学 生命科学学院,北京,100049)

枸杞子为茄科(Solanaceae)植物宁夏枸杞(LyciumbarbarumL.)的干燥成熟果实[1],系著名药材和保健品,具有抗肿瘤、防衰老、降血脂、抗氧化等功效[2-5]。作为一种“药食两用”的植物资源,随着生活水平的提高和保健观念的增强,国内外市场对于枸杞的需求逐渐扩大。枸杞主要以枸杞干果的形式在市场中流通,另外,枸杞果酒、果汁和籽油等相关附加值产品也深受消费者的喜爱[6]。目前,我国枸杞主产区的绝大多数栽培品种均引自宁夏枸杞系列品种[7]。研究表明,不同品种或不同产地的枸杞果实在多酚、糖类、维生素、氨基酸等[8-12]化学成分含量等方面具有较大差异,从而对口感、风味[13]及品质[14]产生不同程度的影响。例如,枸杞多糖含量可作为枸杞果酒的酿造工艺的衡量指标[15],枸杞营养成分含量是枸杞品质评价的指标之一[16]。因此,开展不同品种枸杞的快速、准确判别,有利于根据不同枸杞品种的差异有针对性地开展枸杞资源的利用,提高资源的利用率。

目前,鉴别不同枸杞品种的方法主要有感官判断和化学方法[17],但是视觉和感官判断通常存在较大误差,化学方法则需要对样品进行粉碎、提取等处理,导致对样品的破坏性较大。近红外光谱(near infrared spectrum,NIR)分析技术具有快速、无损、准确等优点,已被成功应用到不同品种和不同产地枸杞的鉴别工作中。例如,许春瑾等[18]利用近红外光谱技术建立了枸杞的产地判别模型,许生陆等[19]建立了枸杞总糖含量快速准确的检测方法,所建的2种模型效果均较好。但以上工作皆未对枸杞品种分辨展开研究。同时,不同种植区的枸杞品质之间存在较大差异[20],目前暂未有产自柴达木盆地的不同中宁枸杞的红外判别方法报道。可见,亟需建立一种快速且准确的鉴别不同枸杞品种方法,方便生产实践的应用。

因此,本文以12个不同品种的中宁枸杞为研究对象,在谱图解析的基础上,利用近红外光谱技术结合化学计量学方法,建立了不同光谱采集方式下的中宁枸杞品种判别模型,实现了枸杞品种的快速直观识别,所建方法在生产实践中具有较好的推广应用价值,为具体生产实践提供了一种更为准确快捷的检测方法。

1 材料与方法

1.1 材料

12个不同品种中宁枸杞样品于2021年成熟期采自青海省柴达木盆地,由青海大学樊光辉副研究员分别鉴定为大麻叶枸杞、蒙杞1号、宁菜杞、宁杞2号、宁杞3号、宁杞4号、宁杞5号、宁杞6号、宁杞8号、宁杞9号、青黑杞1号和中科绿川1号。每个品种分为3份样品,共得到36份样品。样品经真空冷冻干燥后,粉碎,装入自封袋后置于干燥器中避光备用。

1.2 仪器与设备

iS50傅里叶变换红外光谱分析仪,美国Thermo Fisher公司,配有NIR-光纤和NIR-积分球漫反射附件;LGT-10C真空冷冻干燥机,四环福瑞科仪科技发展(北京)有限公司;粉碎机。

1.3 实验方法

1.3.1 光谱采集

利用傅里叶变换红外光谱仪的积分球漫反射附件和光纤探头附件分别采集样品的NIR-积分球光谱和NIR-光纤光谱。采集条件均为扫描次数64次,分辨率4 cm-1,光谱采集范围10 000~4 250 cm-1。光谱采集前预热仪器至少30 min,待仪器稳定后使用,采集过程中实时扣除CO2和水的背景干扰,每份样品采集3次,取平均谱图待分析用。实验室温度保持在25 ℃左右,湿度控制在35%以下。

1.3.2 模型建立与评价

在TQ analyst软件中将样品对应的品种赋值到光谱,再将样品光谱按照2∶1的比例随机分为校正集和验证集。以建模方法:距离匹配(distance match,DM)、判别分析(discriminant analysis,DA),光程类型:Constant、多元散射校正(multivariate scattering correction,MSC)、标准正态变换(standard normal variate,SNV),谱图类型:原谱图、一阶导数谱图(first derivative spectrum,D1)、二阶导数谱图(second derivative spectrum,D2)为因素设计3因素3水平正交试验表(表1)进行正交试验。其中,原谱图时不采用平滑处理,D1和D2时进行Norris平滑处理。

表1 建模条件水平因素表Table 1 Modeling condition level factor of variety discrimination model

根据正交试验下建模条件的组合,记录不同建模组合条件下模型的校正集、验证集和样本集的误判数,以公式(1)~公式(3)分别计算模型的识别率、预测率和准确率,以此为指标判断模型效果。以准确率最高的建模条件组合为实际最优组合,对正交试验结果进行极差分析,得出理论最优组合。将实际最优组合与理论最优组合进行比较,选出最佳建模条件,同时利用相关系数法(correlation coefficient)确定建模波段。最后,利用优化后的建模条件和建模波段建立品种判别模型。比较2种采集方式下模型的效果,建立品种鉴别模型。识别率、预测率、准确率计算分别如公式(1)、公式(2)、公式(3)所示:

(1)

(2)

(3)

利用Python软件,采用支持向量机(support vector machine, SVM)方法建立模型,以识别率、预测率和准确率为指标评价模型。

1.4 数据处理

对2种NIR采集方式下的谱图特征吸收峰进行归属,对谱图进行分析,比较不同采集方式下NIR的异同。其次,分别利用TQ analyst和Python软件,借助DM、DA、SVM等化学计量学分析方法建立不同光谱采集方式下的中宁枸杞品种判别模型,比较不同采集方式下品种判别模型效果的差异。

2 结果与分析

2.1 近红外光谱特征分析

不同采集方式下的原始光谱如图1所示。其中,图1-a为NIR-光纤光谱,图1-b为NIR-积分球光谱。由图1-a可以看出,不同采集方式下的近红外光谱谱图变化趋势一致,说明2种不同的采集方式所获得的光谱信息基本一致。而不同样品表现出不同的吸光度,其差异说明各样品化学成分含量不同,光谱数据符合建立红外品种判别模型要求。

a-NIR-光纤光谱;b-NIR-积分球光谱图1 不同品种中宁枸杞的原始光谱图Fig.1 Original spectra of different varieties of L.barbarum

不同品种中宁枸杞的NIR-光纤光谱有8 249、6 770、6 339、5 775、5 665、5 155、4 740、4 322 cm-1等8个系列特征峰,NIR-积分球光谱有8 277、6 759、6 355、5 791、5 681、5 156、4 735、4 261 cm-1等8个系列特征峰。二者的特征峰吸收位置基本相似。

由于近红外光谱测定的样品通常为不经过提纯等预处理的复杂样品,各种成分混在一起,即使是单纯物质的近红外光谱,其谱峰也常有重叠,复杂物质的近红外光谱,其谱峰重叠更为严重[21]。因此,对各特征峰进行归属,结果发现8 249 cm-1和8 277 cm-1附近为—CH2的二级倍频吸收,6 770 cm-1和6 759 cm-1附近为醇羟基O—H的一级倍频吸收,6 339 cm-1和6 355 cm-1附近为N—H的一级倍频伸缩振动,5 775 cm-1和5 791 cm-1附近为—CH3中C—H的一级倍频吸收,5 681 cm-1和5 665 cm-1附近为—CH2中C—H的一级倍频吸收,5 155 cm-1附近为水羟基O—H的合频吸收,4 740 cm-1和4 735 cm-1附近为N—H的合频吸收峰,4 322 cm-1和4 390 cm-1附近为—CH3和—CH2中C—H的合频吸收[22]。

为深入分析谱图特征,利用一阶导数进行了谱图处理,扩大种间差异性,结果如图2所示。其中,图2-a为NIR-光纤一阶导数谱图,图2-b为NIR-积分球一阶导数谱图。由图2可知,谱图经过一阶导数的处理后,各样品的NIR-积分球谱图差异扩大,且样品的谱图间差异大于NIR-光纤谱图。

a-NIR-光纤一阶导数光谱;b-NIR-积分球一阶导数光谱图2 不同品种中宁枸杞的一阶导数谱图Fig.2 First derivative spectra of different varieties of L.barbarum

2.2 不同采集方式下枸杞品种判别模型

2.2.1 DM、DA模型

将样品的近红外光谱输入TQ analyst软件,按照1.3节方法进行实验。利用正交试验优化NIR-光纤、NIR-积分球建模条件,并对试验结果进行极差分析,结果如表2所示。

表2 建模条件优化结果Table 2 The results of modeling condition optimization

由表2各水平的K值可知,NIR-光纤模型的理论最优组合为A2B3C2,即No.17(DA+SNV+D1)。由R值可知,建模方法是影响判别模型的主要因素,其次为谱图类型,光程类型对模型建立的影响最小。以DA+SNV+D1为建模条件,建模波段为9 880~4 364 cm-1建立品种判别模型,模型识别率、预测率和准确率均为100.00%。NIR-光纤品种判别模型可用于识别不同品种的中宁枸杞。

NIR-积分球除No.1样品外,在其他建模条件下的识别率、预测率和准确率均为100.00%。以DA+SNV+D1为建模条件,建模波段为9 880~4 364 cm-1建立品种判别模型。同一品种样品在空间的同一区域聚集,不同品种间各自分开,表明模型的分类效果较好,可以快速准确判别不同品种中宁枸杞。

2.2.2 SVM模型

将样品的红外数据输入Python软件,在SVM方法下建立2种采集方式下的物种判别模型。其中,NIR-光纤模型的识别率为79.16%,预测率为83.33%,准确率为80.56%;NIR-积分球模型的识别率、预测率和准确率均为100%,二者验证集的分类情况如图3所示。由图3可知,NIR-光纤模型在验证时将蒙杞1号和宁杞5号分类错误,而NIR-积分球模型均识别正确,效果明显优于NIR-光纤模型。

a-NIR-光纤模型分类图;b-NIR-积分球模型分类图图3 NIR-光纤和NIR-积分球品种判别模型分类图Fig.3 Classification diagram of NIR-optical fiber and NIR-integrating sphere model

3 讨论

一阶导数处理能有效提升谱图的信噪比,扩大谱图间差异,有利于提升模型识别效率[23-24]。NIR-积分球一阶导数谱图差异大于NIR-光纤一阶导数谱图,表明积分球漫反射采集方式更适合枸杞样品,所采集的光谱质量更优,由近红外谱图上更能呈现不同品种枸杞间的差异。

SVM在解决小样本、非线性和高维模式识别问题中表现出许多特有的优势,被广泛应用于分类识别[25]。针对红外光谱的分类特征点较多且复杂的特点,SVM可以通过将特征映射到核空间中降低问题的复杂性,提高分类的准确率[26],使得分类效果在众多算法模型中脱颖而出。作为一种二元分类模型,SVM在其他药材的的定性鉴别上也取得了良好的效果[27-28]。因此,本研究采用了SVM作为建模方法进行分类。研究结果也表明,使用SVM开发的分类模型具有很强的鲁棒性,可以高置信度地对中宁枸杞的品种进行分类。

比较DM、DA、SVM品种判别模型,均表现为NIR-积分球的分类判别结果优于NIR-光纤结果,虽然二者的准确率均为100.00%,但NIR-积分球模型的区分效果明显优于NIR-光纤模型,在3D空间中无交叉,空间投影也相互独立,分类效果更好,表明NIR-积分球采集方式更适用于不同品种中宁枸杞的分类鉴别。耿姝[29]以三七粉末样品为例,对NIR-积分球和NIR-光纤2种采集方式下的原始光谱及建模效果进行了分析,发现二者的光谱峰形基本一致,但积分球下的光谱更光滑,信噪比更高,谱图质量更优,且所建模型也以积分球模型效果更佳,这与本研究结果一致。

选择更合适的光谱采集方式,结合适当的预处理方法,辅以化学计量学方法等“辅助分析手段”,能有效地提取样品的光谱信息,进而提高模型整体性能[30-31]。

4 结论

利用近红外积分球漫反射和光纤探头2种采集方式获取了不同品种中宁枸杞的近红外光谱,并对2种谱图进行了分析,结合化学计量学方法,建立了品种快速识别模型,主要结论如下:a)2种采集方式下的一维近红外谱图峰形基本一致,但经过一阶导数处理后,样品在积分球采集方式下得到的光谱图间差异扩大,且差异程度大于光纤探头模式的谱图;b)NIR-积分球模型效果优于NIR-光纤模型,识别率、预测率和准确率均达到100%。研究表明,近红外光谱技术在定性检测中是可行的,所建立的模型可准确地鉴别不同品种中宁枸杞,且积分球漫反射附件采集得到的光谱效果优于光纤探头附件。

猜你喜欢
积分球枸杞光纤
是酸是碱?黑枸杞知道
积分球球内温度对光通量测量值的影响
FIBBR King-A系列HDMI光纤线
宁夏六月枸杞红
采枸杞
高品质的忠实还原 FIBBR Ultra Pro2 HDMI光纤线
枸杞到底是怎么养生的?
一条光纤HDMI线的诞生长飞/长芯盛FIBBR工厂走访实录
全国产1550nm 窄脉宽光纤放大器
基于积分球数据的面阵航测相机影像辐射校正