可见/近红外快照式多光谱成像快速测定雨生红球藻虾青素含量

2023-08-13 06:07占秀兴黄春红谢友坪
食品工业科技 2023年16期
关键词:球藻青素波长

沈 英,占秀兴,黄春红,谢友坪,黄 峰,

(1.福州大学机械工程及自动化学院,福建福州 350108;2.福州大学生物科学与工程学院,福建福州 350108)

虾青素,又名虾红素、虾黄质,因其显著的抗氧化性成为国内外研究热点,具有多种生物活性[1],在化妆品[2]、生物医药[3]、食品[4]、水产养殖[5]等领域应用广泛。雨生红球藻是目前工业化生产天然虾青素的主要生物,而生长过程中积累的虾青素含量指标是其收获的重要依据[6-8]。

传统的虾青素含量检测方法主要有分光光度法、高效液相色谱法及液质联用法等[9],此类方法均需要利用物理或化学的方式对样品进行前处理,处理过程复杂,成本高,使用的化学试剂对人体或环境有着潜在的危害[10]。因此,需要探索一种对环境友好,经济快速的检测方式。光谱成像作为一种无损检测技术,可实现物质内部组分的定性定量分析[11]。在色素检测方面,Zhang 等[12]通过多光谱成像技术结合机器学习方法,建立了良好的大白菜多种光合色素含量预测模型;Kwon 等[13]利用无人机拍摄的高光谱图像反演出藻类色素的时空分布;Duppeti 等[14]通过可见/近红外漫反射光谱对小球藻及其混合培养物的生物量和色素进行了定量分析;蒋林军[15]应用高光谱成像技术构建了雨生红球藻虾青素含量检测模型。高光谱成像虽然能获取更多的光谱细节,信息量大,但波段间的相关性高、数据冗余、成像速度慢,而快照式光谱在原光谱成像技术基础上实现了单次曝光即能获取完整光谱数据立方体,大大提高成像速度和灵敏度[16],在其已有的应用研究中,Yu 等[17]采用25 波段近红外快照式多光谱相机搭建检测系统,实现了对干胡萝卜片含水量与收缩率的快速无损检测。这种成像快、满足动态场景、尺寸小的快照式多光谱成像技术有望为微藻色素领域的检测提供新方案。

本研究基于快照式可见/近红外多光谱漫反射成像技术,设计搭建检测系统,以雨生红球藻虾青素为研究对象,探究其含量变化与光谱信息的联系,采用化学计量学方法,建立可见光全光谱及可见-近红外全光谱的预测模型,比较确定最佳光谱预处理方法,并通过特征波长提取确定雨生红球藻虾青素光谱检测有效波段,建立基于特征波段的预测模型,并与全光谱模型对比分析,为实现高精度快速无损测定雨生红球藻虾青素含量提供理论及技术指导。

1 材料与方法

1.1 材料与仪器

雨生红球藻(Haematococcus pluvialis)藻种 澳大利亚昆士兰大学Peer Schenk 教授提供;氢氧化钠(分析纯)、甲醇、二氯甲烷、乙醇 色谱纯,国药集团化学试剂有限公司;丁基羟基甲苯、甲基叔丁基醚色谱纯,Acros Organics 公司;乙酸铵 色谱纯,Sigma-Aldrich 公司;三乙胺 色谱纯,Fisher Chemical 公司。

Mini Bead Beader 珠磨破碎机 Bsp Biospec Products;FD-2 真空冷冻干燥机 北京博医康实验仪器有限公司;AB104N 电子天平 Sartorius 公司;TGL-20bR 高速冷冻离心机 上海安亭科学仪器厂;PGX-450D 智能光照培养箱 宁波海曙赛福实验仪器厂;LC-20 高效液相色谱仪 岛津仪器(苏州)有限公司;多光谱图像采集系统如图1 所示,系统主要分为五个部分:多光谱相机、光源、计算机、样本固定平台及暗箱。其中,光源由4 个50 W 卤素灯面光源组成,在每个灯杯前固定一块高透光率的磨砂玻璃,保证光照的均匀性;两台相机均采用德国XIMEA 公司研制的快照式多光谱相机,一台为可见光相机(MQ022HG IM SM4×4 VIS),可获得在480~635 nm光谱范围内13 个波段的漫反射光谱图像,光谱分辨率约为10 nm,单波段图像分辨率为512×272 pixels,另一台为近红外相机(MQ022HG IM SM5×5 NIR),可获得在665~950 nm 光谱范围内25 个波段的漫反射光谱图像,光谱分辨率约为10 nm,单波段图像分辨率为409×217 pixels。相机镜头均使用Edmund公司的35 mm 镀可见光-近红外膜紧凑型定焦距镜头(VIS-NIR,#67-714)。

图1 多光谱图像采集系统示意图Fig.1 Schematic of the multispectral image acquisition system

1.2 实验方法

1.2.1 微藻样本的制备 雨生红球藻接种在经120 ℃高温灭菌的BBM 培养基上,在智能培养箱中进行培养,设置培养箱温度为25 ℃,光照强度为60~160 μmol/m2/s,培养瓶外接CO2作为碳源,将培养瓶置于磁力搅拌器上,转速为250 r/min,使沉于瓶底的藻细胞悬浮到营养液中,实验样本来自培养0、48、96、144 h 后的雨生红球藻,为扩充样本量,分别稀释0~8 倍,制作22 个不同梯度样本,每个浓度梯度设置6 个平行样本,共计126 个样本。

1.2.2 光谱图像的采集与校正 本研究采集图像所使用的快照式多光谱相机将像素级Fabry-Pérot 滤镜马赛克阵列直接集成在现有工业相机的CMOS 芯片上,在相机的每个像素上进行不同波段的光谱镀膜,采集光谱图像时无需光栅、滤光片等分光器件,具有成像速度快、灵敏度高、体积小等特点;相机在密闭的暗箱中以卤素灯作为光源采集漫反射光谱图像,避免外界环境的干扰,将制备好的样本依次放置在载物台上,物距为450 mm,卤素灯距载物台为350 mm,光源入射角度与竖直方向成30°夹角,两台相机同时拍摄,曝光时间设置为2.0 ms,每个样本重复采集光谱图像三次取其反射率的平均值。为消除光源分布不均及仪器环境的影响,须对采集的样本光谱图像进行校正,校正公式如下[18]:

其中,R 为校正后的光谱图像; Iraw为校正前原始光谱图像; Idark为关闭光源的全黑图像;Iwhite为标准白板图像。获取图像后,为减少样本背景信息的干扰,通过ENVI 5.1(ITT Visual Information Solutions,United States)软件提取感兴趣区域,实验数据建模分析主要通过Matlab R2020a(The Math Works, Natick,USA)软件来完成。

1.2.3 虾青素含量的测定 高效液相色谱法是色素组分含量测定的常用方法,参考马瑞娟[19]、欧阳琴[20]报道的方法。在测定前先进行虾青素的提取,采用机械破壁与溶剂提取结合的方式,首先将待测藻液于8000 r/min 转速下离心5 min,冷冻干燥后得到藻粉,而后称取10 mg 藻粉,加入一定量二氯甲烷/甲醇(1:1,v/v),破碎、离心、收集上清液,重复提取至上清液为白色,经吹干后,加入适量氢氧化钠甲醇溶剂、甲醇/乙醇溶剂(2:1,v/v),充分皂化后利用玻璃纤维膜过滤;完成提取后采用高效液相色谱仪进行含量检测,设定色谱柱YMC·Cartenoid·RP-30(4.6 mm×250 mm×5 μm)、进样量20 μL、流速1 mL/min、检测波长450 nm、柱温30 ℃,流动相A:称取3.854 g乙酸铵和1 g 丁基羟基甲苯溶解于800 mL 甲醇,加0.5 mL 三乙胺和30 mL 水,混匀,再加一定量甲醇定容至1 L;流动相B:称取0.5 g 丁基羟基甲苯溶解于400 mL 甲基叔丁基醚,加0.25 mL 三乙胺,混匀,再加一定量甲基叔丁基醚定容至500 mL,而后根据Chen 等[21]报道的方法,按特定的洗脱条件完成测定。

1.3 数据处理

1.3.1 光谱预处理 快照式多光谱相机相邻波段间隔大,滤镜单元拼接在同一光谱体素内,空间分辨率低[16],采集样本光谱图像过程中,成像易受到外界环境的干扰,例如散射光、噪声、背景信息等[22]。为尽量减少该类误差,采用一阶导数(first derivation,FD)、卷积平滑(Savitzky-Golay,S-G)、标准正态变量变换(standard normal variable transformation,SNV)三种预处理方法。其中,FD 能有效增强光谱细节,消除背景干扰,分辨重叠峰,本实验设置窗口宽度为3;S-G 通过平滑拟合处理用于去除仪器环境等引起的高频噪声,可提高光谱整体的信噪比,本实验设置5 点平滑、3 次多项式拟合;SNV 可以减小光程变换或样品表面散射对光谱信息的干扰[23]。通过建立基于不同预处理的全光谱预测模型,对比确定最佳预处理方法,以提高模型的精度。

1.3.2 模型的建立与评价指标 特征波长是所研究目标组分光谱信息的重要参考,从全光谱中选择少量有代表性的特征波长,不仅能够减少光谱冗余信息,避免产生共线性问题,而且为基于特征波段研发的便携式设备提供理论依据。本实验采用连续投影算法(successive projections algorithm,SPA)和竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)优选特征波长,在保证预测精度的同时,降低光谱维数,减少运算量[24-25]。化学计量学建模方法是光谱分析预测的关键,本实验主要在光谱信息与组分含量间建立可靠的统计学关系,实现对未知样本的预测目的,采用偏最小二乘回归(partial least square regression,PLSR)和反向传播(back propagation,BP)神经网络分别建立预测模型。PLSR 结合了相关分析、主成分分析及多元线性回归方法特点,可同时考量光谱信息与组分含量间的关系,是光谱数据建模中常用的线性回归方法[26],因子数是影响PLSR 模型的关键参数,因子数的过多或过少会导致模型的过拟合或欠拟合,实验过程中采用留一交叉验证确定最佳因子数;BP 神经网络由输入层、隐藏层及输出层组成,是一种误差反向传播的多层前馈神经网络,以更新网络权重的方式多次训练,具有优异的非线性映射逼近能力,在神经网络模型中应用广泛,网络的参数设置会影响模型结果,例如传递或训练函数、节点数、迭代次数等[27],故各模型的参数均一致,本研究中使用tansig 作为传递函数,trainlm 作为训练函数,单个隐含层,神经元个数为5,学习速率0.1,迭代次数1500 次,误差阈值1×10-5。

对不同算法组合建立的预测模型之间比较分析需要量化的评价指标,采用校正集相关系数(Rc)、预测集相关系数(Rp)、校正集均方根误差(root mean square error calibration,RMSEC)、预测集均方根误差(root mean square error of prediction,RMSEP)和剩余预测偏差(residual predictive deviation,RPD)对建立的各个雨生红球藻虾青素含量预测模型进行评价。RMSEC、RMSEP 越小,Rc、Rp 越接近1,模型的预测性能越好,当RPD>3.0 时,模型具有良好的稳定性及预测精度[28]。

2 结果与分析

2.1 虾青素含量统计分析

完成所有雨生红球藻样本的虾青素含量测定后,根据样本集划分原则,预测集样本中待测组分的含量应当包含建模集待测组分的范围内,将126 个样本按2:1 比例随机划分校正集和预测集,得到校正集84 个、预测集42 个,总样本、校正集和预测集的虾青素含量统计信息如表1 所示,从数据的统计结果来看,校正集可以很好地代表总体样本情况,预测集样本的虾青素含量包含在校正集样本范围内,说明预测集样本可以验证校正集样本所建立的模型的有效性。

表1 样本集划分及虾青素含量数据统计Table 1 Sample set division and astaxanthin content data statistics

2.2 原始光谱分析

根据刘燕德等[29]将可见与近红外光谱联用检测柑桔黄龙病的研究,光谱拼接后相比单一可见或近红外可提高检测精度,并且经预处理后的拼接光谱模型精度提高更加明显。图2 展示了如何将光谱图像转换为光谱数据曲线,在获取校正后的可见/近红外漫反射光谱图像后,如图2a、图2c 所示;感兴趣区域取样本光谱图像正中央50×50 pixels,以该区域内的像素平均值作为样本光谱反射率,对不同波段下的感兴趣区域提取计算,如图2b、图2d 所示;并将可见和近红外多光谱两台相机波段直接拼接,得到126 个雨生红球藻样品拼接后的原始光谱曲线,如图2e 所示,首先,整体曲线的反射率随着虾青素含量的提高而降低,变化趋势类似,其次,在可见光范围内520 nm附近的波谷,很有可能是细胞内类胡罗卜素或虾青素的吸收产生的,540~640 nm 是叶绿素的强吸收带,可见光波段主要是色素的吸收区,近红外波段主要反映含氢基团振动的倍频、合频吸收信息[15,30],因此可见-近红外光谱联用理论上可以获得更加全面的光谱信息,在测定雨生红球藻虾青素含量方面比仅用吸收峰所在的可见光光谱更准确。

图2 可见/近红外多光谱图像数据提取Fig.2 Data extraction from visible/near infrared multispectral images

2.3 基于不同预处理的全光谱建模

光谱预处理能够增强待测组分的光谱信息,减弱噪声带来的干扰,但采用不同的预处理方法所建立的预测模型精度会有所差异,需要通过评价指标进一步确定[31]。建立基于在不同预处理下的可见-近红外和可见光全光谱PLSR 预测模型结果如表2 所示,从表中可分析出,相比于原始光谱所建立的模型,在可见-近红外全光谱范围内,S-G 是表现最佳的预处理方法,其RMSEP 为0.5710,Rp 为0.9529,RPD为3.2969,在可见光谱范围内,只有FD 预处理提高了模型的预测精度,可能是在处理过程中有效信息被当作噪声过滤去除导致,基于FD 预处理建立的模型RMSEP 为0.7969,Rp 为0.9307,RPD 为2.7339。因此,对于PLSR 所建立的模型,选择S-G 作为可见-近红外光谱范围的预处理方法,因子数为5,选择FD 作为可见光谱的预处理方法,因子数为4。

表2 不同预处理下虾青素含量PLSR 预测结果Table 2 PLSR prediction results of astaxanthin content in different pretreatments

与PLSR 预测模型类似,建立不同预处理下的全光谱BP 神经网络模型如表3 所示,可知在可见-近红外和可见全光谱范围内,经FD 处理后的BP 神经网络模型预测效果最好,其评价指标值分别为:可见-近红外光谱中RMSEP 为0.5456,Rp 为0.9571,RPD 为3.4504;可见光谱中RMSEP 为06065,Rp为0.9467,RPD 为3.1042。BP 神经网络所建立的模型在不同光谱范围预处理上均体现出FD 为最佳预处理方式,所以选择FD 为后续模型的预处理方法。通过与表2 的PLSR 模型精度比较,可知BP 神经网络所建立的全光谱模型预测性能普遍优于PLSR 模型。

表3 不同预处理下虾青素含量BP 神经网络预测结果Table 3 BP neural network prediction results of astaxanthin content in different pretreatments

2.4 基于特征波长的建模结果分析

2.4.1 特征波长的选择 在全光谱分析的基础上进一步分析特征波长建模,首先基于最佳预处理后的光谱数据进行特征波长的选择。以CARS 算法对可见-近红外光谱经FD 预处理后的数据处理为例,其结果如图3 所示,蒙特卡罗采样次数设定为50,并采用五折交互验证均方根误差(root mean square error of cross validation,RMSECV)来评价。由图3a 可知,随着采样次数的增加,在指数衰减函数的作用下,有效波长变量数逐渐减少[32];从图3b 中可看出,采样次数为13 时,RMSECV 达到最小值0.5444,并由图3a 得到,此时选择的波长变量数为7,在13 次采样后,RMSECV 又逐渐升高,说明在这之后可能剔除了与实验中雨生红球藻虾青素含量相关的波长;选择波长时各变量所属的回归系数路径如图3c 所示。

图3 采用CARS 算法选取特征波长Fig.3 Characteristic wavelength selected by CARS algorithm

以FD 预处理后的可见光谱数据为例介绍SPA选择特征波长的过程,该算法以设定的变量数范围,求取任一波段的投影向量最大值列入候选波段子集[33],本研究中算法特征波长数量选取的最小值设为3,最大值设为8。由图4a 可知,根据不同子集的均方根误差随波长个数变化关系,当模型变量个数为4 时,RMSE 值最小,该子集为最佳波长组合,所选择的4 个与雨生红球藻虾青素含量相关的特征波长在原始光谱上的位置如图4b 所示。

图4 采用SPA 算法选取特征波长Fig.4 Characteristic wavelength selected by SPA algorithm

与上述波长选择过程类似,不同光谱、不同预处理的特征波长选择结果如表4 所示,所选择的波长主要集中在488、635、686 nm 附近,这与蒋林军[30]研究中使用高光谱成像筛选出的492、633、679 nm波段相近,说明这些波段是检测虾青素的重要波段,经CARS 和SPA 算法降维处理后,所使用的波长数量明显减少,能够避免波段冗余,提高模型的处理速度。

表4 基于CARS 和SPA 选择后的特征波长Table 4 Characteristic wavelength selected based on CARS and SPA

2.4.2 模型的建立 经预处理后,利用CARS 和SPA算法筛选特征波长,基于此特征波长建立雨生红球藻虾青素含量的PLSR 和BP 神经网络预测模型如表5 所示。首先,波长优选后以较低复杂度的模型仍能达到较好的预测效果,略优于全光谱模型,其次,在所建立的预测模型中,可见-近红外联合光谱经FD-CARS-BP 处理后所建立的模型精度最高,共计7 个特征波长,RMSEP 为0.5126,Rp为0.9622,RPD为3.6726,优于PLSR 所建立的最佳模型S-G-CARSPLSR,因子数为4,RMSEP 为0.5817,Rp为0.9511,RPD为3.2364,模型预测结果散点图如图5 所示。FDCARS-BP 所建立的模型精度比可见光谱中的最佳模型高,说明在近红外区域含有与雨生红球藻虾青素光谱信息相关的波段,仅依靠可见区域不能达到最佳预测性能。综上,应用光谱成像技术与化学计量学方法能够较好的测定雨生红球藻虾青素含量,在光谱范围上,可见-近红外联合能获得更为全面的光谱信息,一定程度上提高预测精度。

表5 基于特征波长的虾青素含量模型结果Table 5 Results of astaxanthin content models based on characteristic wavelength

图5 模型预测结果Fig.5 Model prediction results

3 结论

本研究利用可见/近红外快照式多光谱成像技术,构建了不同光谱范围、多种算法组合下的雨生红球藻虾青素含量预测模型,评估了快照式光谱成像技术在测定雨生红球藻虾青素含量方面的可行性。

经对比发现,全光谱建模或基于特征波长建模,可见-近红外光谱相比单一可见光光谱模型的预测能力均表现更好,说明在近红外范围内含有可解释雨生红球藻虾青素的波段,结合可见和近红外光谱能获得更为全面的光谱信息,所建立的预测模型也更为可靠。基于特征波长所建立的模型精度优于全光谱模型,其中经FD 光谱预处理后所建立的CARS-BP 神经网络模型效果最佳,其RMSEP 为0.5126,Rp为0.9622,RPD 为3.6726,全光谱中最佳模型为经FD光谱预处理后所建立的BP 神经网络模型,其RMSEP为0.5456,Rp为0.9571,RPD 为3.4504,可知波长筛选在保证精度的同时,去除了对模型贡献率较小的波长,波长数量从38 个减少为7 个,提高了模型运算速度。综上,可见/近红外多光谱成像技术结合化学计量学方法构建的模型可实现对雨生红球藻虾青素含量的快速、无损测定,对工业生产中监测雨生红球藻虾青素的积累具有重要意义。

猜你喜欢
球藻青素波长
HPLC-PDA双波长法同时测定四季草片中没食子酸和槲皮苷的含量
真菌Simplicillium lanosoniveum DT06 对雨生红球藻生长与脂类合成的影响
6000倍抗氧化能力,“完爆”维C!昶科将天然虾青素研发到极致
虾青素在设施草莓上的应用效果
球藻沉浮的秘密植物
聚球藻硅质化作用初探
双波长激光治疗慢性牙周炎的疗效观察
日本研发出可完全覆盖可见光波长的LED光源
反相高效液相色谱法检测鲫鱼组织中的节球藻毒素
便携式多用途光波波长测量仪