显微高光谱技术检测肌细胞中超氧化物歧化酶活力的方法研究

2019-09-23 07:10吴龙国贺晓光王松磊
食品工业科技 2019年17期
关键词:波长校正预处理

董 欢,吴龙国,贺晓光,王松磊

(宁夏大学农学院,宁夏银川 750021)

超氧化物歧化酶(Superoxide dismutase,SOD)又称肝蛋白,含有金属铜离子,是存在于生命体中的一种活性球蛋白物质。SOD可以消除生物体在新陈代谢过程中产生的有害物质,免受氧自由基的毒害作用,是生物细胞保护体系的一员[1-3]。生物体内SOD酶活力的大小能说明其健康程度,因此可以将酶活力作为肉类品质检测和质量评价的参考指标。一般实验室进行样本的理化检测时,前处理及实验方法繁琐,检测时间长,试剂消耗量大,不能满足批量肉类生产过程中在线快速检测的要求。

显微高光谱成像技术是将显微成像与近红外光谱的官能团化学分析相结合的一种新型技术,通过显微成像系统与高光谱系统有机组合,实现微观组织空间分布的可视化及定量分析,从而分析物质内部结构组分的变化。该技术是一种快速无损检测新技术,可以对样本进行批量、快速、准确的测量;无需化学试剂和复杂的样品前处理,可直接对鲜活组织细胞进行扫描,大幅降低分析成本和检测时间,直接提取酶相关的特征波段,为肉类SOD酶活力在线快速无损检测技术的创新提供新途径。

近几年,国内外学者对植物SOD酶活力及显微成像技术分别进行了大量的研究,但用显微高光谱技术对肉类样本中SOD酶活力的研究鲜有报道。刘婷婷等[4-5]分别对冬小麦和油菜叶片中SOD酶活力进行高光谱检测,相关性均能达到0.8以上,说明基于高光谱模型的SOD生理活性的检测是可行的。马天兰等[6-7]提取显微高光谱图像信息,分别采用菌落总数、挥发性盐基氮对羊肉和猪肉新鲜度进行表征,其判别率均达到90%以上。石冬冬等[8]应用近红外显微成像技术结合化学计量学方法,对蛋鸭饲料中的苏丹红进行检测,判断饲料中是否非法添加苏丹红,准确率达89.2%。Matthew等[9]使用显微高光谱成像系统对鸡肉沙门氏菌进行检测研究,实验用100倍物镜收集并提取450~800 nm之间的细胞光谱特征,得出细胞分类准确度81.8%~98.5%。Luisa等[10]用拉曼显微光谱研究玻璃化温度对体外成熟绵羊卵细胞皮质肌动蛋白诱导的变化,结论证明拉曼显微镜可作为研究玻璃化卵细胞变化的替代分析工具。Santos等[11]采用红外显微成像技术对牛奶中掺假物质进行定量检测分析,估计牛奶掺假水平并定位其位置和浓度;Philippe等[12]使用红外显微光谱对小麦胚乳发育过程中细胞壁多糖的沉积进行分析检测,并通过评估二阶导数来进行光谱数据分析。Baranska等[13]使用显微拉曼成像技术检测类胡萝卜素含量,并定位其在细胞内的分布。

本研究以滩羊肉肌细胞中的SOD酶活力为研究对象,结合显微高光谱成像技术采集样品380~980 nm的显微光谱图像。首先使用蒙特卡洛方法进行异常样本的剔除,并使用共生距离法、随机法和Kennard-Stone法进行校正集和预测集的划分;然后对原始光谱进行预处理,优选最佳预处理方法;使用间隔随机蛙跳算法、遗传偏最小二乘算法、反向区间偏最小二乘法等六种方法进行特征波长提取;最后对比分析不同特征波长下的偏最小二乘回归、主成分回归以及多元线性回归模型,优选最佳预测模型,为今后显微高光谱成像技术在肉品微量成分检测方面提供理论和技术参考。

1 材料与方法

1.1 材料与仪器

滩羊 宁夏盐池县鑫海食品有限公司;A045-2蛋白定量测试盒(考马斯亮蓝法) 南京建成生物工程研究所;A001-1-1总超氧化物歧化酶测试盒(羟胺法) 南京建成生物工程研究所;生理盐水 湖南科伦制药有限公司;冰乙酸 分析纯,北京鹏彩化学试剂有限公司。

Micro-Hyper Spec VNIR显微高光谱成像系统(380~980 nm,分辨率3.5 nm,176个波段) 北京卓立汉光仪器有限公司;KD-2508冷冻切片机 浙江金华市科迪仪器设备有限公司;FA25 FLUKO间歇式高剪切组织匀浆机 上海弗鲁克科技发展有限公司;Neofuge15R台式高速冷冻离心机 上海力申科学仪器有限公司;753N紫外可见分光光度计 上海仪电分析仪器有限公司;HH-4电热恒温水浴锅 上海比朗仪器有限公司;SQP电子天平 赛多利斯科学仪器(北京)有限公司。

1.2 实验方法

1.2.1 肌细胞显微样本制备 样本选取新鲜屠宰1 h内的30只健康滩羊的背部(外脊)、前腿和后腿三个部位,装入密封袋中,置于低温采样箱中运输至实验室进行4 ℃保存。实验前,将样本放至室温,除去脂肪和肌膜,修整切块(20 mm×10 mm×10 mm),获得223个样本。将样本放置冷冻切片机的冷冻平台上,冷台温度设置-40 ℃,刀片温度设置-30 ℃,切片厚度15 μm,制备显微光谱样本,标号以备光谱采集使用。

1.2.2 显微高光谱图像采集 采用Gaia Field-Pro-V10显微高光谱成像系统及SpecView2.9. 2.10数据采集软件,采集光谱图像前需要进行黑白校正[14-18]及扫描参数的设定。经过多次预实验调整,最终确定最佳扫描参数:扫描前进速度0.1 cm/s,回退速度}起点位置0.6 cm,扫描距离0.5 cm,曝光时间1.9 ms,增益1,黑白校正如公式(1)所示。

式(1)

式中:R:黑白校正后光谱图像强度;R0:原始光谱图像强度;D:黑校正图像强度;W:白校正图像强度。

1.2.3 超氧化物歧化酶活力的测定 称取1.0000 g样本,按样本:生理盐水1∶9 (g/mL)进行冰水浴,使用机械10000~15000 r/min上下研磨匀浆,匀浆后2500 r/min冷冻离心12 min,取上清液用生理盐水按体积比1∶9的比例稀释成1%组织上清液,待测。

使用蛋白定量测试盒对1%浓度的组织上清液中蛋白浓度进行测定,使用紫外分光光度仪在595 nm处读取吸光度值,根据公式(2)计算待测样本蛋白浓度;使用总超氧化物歧化酶测试盒对1%浓度的肉组织上清液中的SOD酶活力进行测定,使用紫外分光光度仪在550 nm处读取吸光度值,根据公式(3)计算待测样本SOD酶活力。

式(2)

式中,标准品浓度为0.563 g/L。

式(3)

1.3 数据处理

1.3.1 样本异常值剔除 实验过程中,由于样本、仪器以及人为等因素的影响,导致少量样本的光谱信息和理化值存在差异,这些样本被看作是异常样本。使用蒙特卡洛采样法计算223个样本的均值与标准差的大小,分别取样本均值和标准差值各自平均值的2.5倍作为阈值,将均值或标准差阈值以外的样本判定为异常值[19]。

1.3.2 样本集划分 采用Kennard-Stone(KS)法、Sample Set Partitioning Based on Joint x-y Distance(SPXY)法以及Random sampling(RS)法按3∶1比例对剔除异常值后样本进行划分,并建立偏最小二乘回归模型比较分析。

1.3.3 预处理方法选择 由于图像采集时仪器噪音和暗电流等因素的影响,以及提取的光谱信息中其他无用信息的干扰,因此需要对原始光谱进行预处理,以此增强光谱信号,提取有用信息[20-22]。本文使用卷积平滑(Savitzky-Golay,SG)、归一化法(Normalize)、基线校准(Baseline)、标准正态变量变换(SNV)、去趋势化(Detrend)、多元散射校正(MSC)6种方法进行预处理,并建立偏最小二乘回归模型进行分析比较。

1.3.4 特征波长提取 为了后期建模过程的快速、方便进行,减少波段个数,降低光谱维数,减小数据冗余,有利于实现快速检测[23-25]。利用MATLAB软件,使用间隔随机蛙跳算法(Interval Random Frog,IRF)、遗传偏最小二乘算法(Genetic Algorithms PLS,GA)、反向区间偏最小二乘法(Backw ard interval PLS,BiPLS)、竞争性自适应重加权法(Competitive Adaptive Reweighted Sampling,CARS)对剔除异常值后使用MSC预处理的样本进行特征光谱的提取。数据选择时,根据所选波段的交互验证均方根误差(RMSECV)最小决定特征波长,RMSECV越小说明模型稳定性越好,预测结果的能力越强。

1.3.5 预测模型的建立 使用The Unscrambler X 10.4分析软件对提取特征波长后的光谱反射率进行建模。分别建立基于肌细胞中SOD酶活力定量分析的偏最小二乘回归(Partial Least Squares Regression,PLSR)、主成分回归(Principal component regression,PCR)、多元线性回归(Multiple Linear Regression,MLR)预测模型。

2 结果与讨论

2.1 原始光谱图像处理及样本异常值的剔除

采用ENVI4.8软件进行显微图像感兴趣区域(Region of Interest,ROI)的提取,每个样本图像选取10个ROI进行提取,计算其平均反射光谱,将其作为该样本的反射光谱。实验提取的肌细胞原始显微高光谱图如图1所示。

图1 显微样本原始光谱曲线Fig.1 The original spectral curves of the microscopic sample

结果如图2所示。模型中的46、164、165、120、73、43、190、30、44、215、176号11个样本明显位于临界线之外。剔除上述异常值前后建立的偏最小二乘回归模型效果见表1。由表1可以看出,所得模型的交互验证均方根误差及校正模型的均方根误差(RMSEC)均小于原始样本模型,同时模型的校正集相关系数Rc为0.8115大于原始样本模型,说明剔除这些样本后,模型相关性变大,稳定性增强。因此剔除11个异常样本,剩余212个后续处理。

表1 异常样本剔除前后SOD酶活力的PLSR模型Table 1 PLSR model of SOD enzyme activity before and after abnormal sample rejection

图2 肌细胞中SOD含量样本分布图Fig.2 Distribution of SOD content in muscle cells

2.2 样本划分方法的选择及模型建立

由表2可以得出,在三种划分方法中,仅RS法的预测集相关系数Rp大于0.8,高于其它两种方法。除此之外,还可以利用Rc与Rp之和来说明模型总体精确度[26-27],数值之和越大说明精确度越高。RS法之和为1.6262,KS法为1.6035,SPXY法为1.6082,并且RS法建立的模型中,RMSE值均较小。综合分析各个参数,最终选择RS法划分滩羊肉中SOD酶活力样本集。

表2 不同样本划分方法对SOD酶活力的PLSR模型结果统计Table 2 Results of different sample partition methods on PLSR model of SOD activity

由表3数据可以得出,使用RS法对样本中SOD酶活力值进行划分也是可行的。不同部位样本中SOD酶活力分布范围广,并且预测集的酶活力值包含在校正集的酶活力值范围之内。校正集和预测集的标准偏差也比较理想,由此可以说明所选的样本数据集的划分具有代表性,是有实验意义的。同时样本数据量较大,也满足了建模的要求,可以对此数据进行建模分析。

表3 样本SOD酶活力统计表Table 3 Statistics on SOD activity

2.3 预处理方法的选择

从表4得出,使用MSC预处理后建立的PLSR模型具有较好的模型参数,和剔除异常值后的原始数据相比,Rc和Rp值均有所提高,RMSEC和RMSEP均减小。综合各项参数,最终选定MSC为处理样本的预处理方法。图3为经过MSC预处理后的样本光谱图像。

表4 不同预处理方法对SOD酶活力的PLSR模型结果统计Table 4 Results of the PLSR model of different pretreatment methods for SOD activity

图3 MSC预处理后的样本光谱图Fig.3 Spectral image of sample after MSC pretreatment

2.4 特征波长的选取

由表5可知,6种特征波长提取方法中,CARS提取的特征波长共20个,占总波长的11.4%;GA提取21个,占11.9%;BiPLS提取94个,占53.4%;IRF提取出59个,占33.5%。由于BiPLS和IRF提取的特征波长较多,因此将二者与CARS联合使用,方法的叠加使用,可以在保证相关性的基础上减少光谱的维数。BiPLS-CARS提取的特征波长数最少,共有11个,占总波长的6.3%;IRF-CARS提取的特征波长有23个,占总波长的13.1%。6种方法所选波长分布均匀,各个波段均有挑选,降低了光谱的维数,方便后期建立模型。

表5 特征波长选取统计表Table 5 Characteristic wavelength selection statistics

2.5 建模方法的比较分析

2.5.1 偏最小二乘回归模型 由表6得出,BiPLS-PLSR和BiPLS-CARS-PLSR模型的参数指标较为接近,但后者的波长数只有11个,远远低于BiPLS-PLSR模型,因此说明利用BIPLD-CARS提取特征波长的方法是可行的,IRF-PLSR和IRF-CARS-PLSR模型的情况同上。GA挑选出的波长建立的模型具有较高的Rc、Rcv值,较低的RMSEC和RMSECV值,校正模型优于其他三种模型;从预测能力上看,GA-PLSR拥有最高的Rp值和较低的RMSEP值,说明该模型预测能力较好较稳定。综合各个参数,对于PLSR的6种模型,GA挑选出来的波长所建立的是最优模型。

表6 不同特征波长的肌细胞中SOD酶活力定量分析 PLSR模型Table 6 PLSR model of SOD enzyme activity in cells with different characteristic wavelengths

2.5.2 主成分回归模型 从表7得出,同时,BiPLS-PCR与BiPLS-CARS-PCR模型相比,后者虽然只有11个波长,但参数性能较低,稳定性不高,预测能力不及BiPLS-PCR,不能作为替代模型,说明在BiPLS-CARS联合使用时,贡献率较大的波长被忽略,挑选出来的波长不足以代表所有信息。IRF-PCR和IRF-CARS-PCR模型的性能指标接近,后者只有23个波长,因此IRF-CARS-PCR模型可以作为替代模型。在6种模型中,GA-PCR的R值均较大,RMSE值最低,说明模型校正能力强,稳定性优于其他模型,预测也较为准确。因此GA-PCR是最优模型。

表7 不同特征波长的肌细胞中SOD酶活力定量分析 PCR模型Table 7 PCR model of SOD enzyme activity in cells with different characteristic wavelengths

2.5.3 多元线性回归模型 由表8得出,BiPLS-CARS-MLR模型的相关性系数R均大于0.8,且均方根误差较小。说明该模型与BiPLS-MLR相比,稳定性更好,预测能力也较强,波长数也只有11个,大大降低了模型的维数。IRF-CARS-MLR模型的波长数只有23个,是IRF-MLR模型波长数的一半,但是模型参数整体不如IRF-MLR,稳定性较低。CARS-MLR模型的R值均大于0.8,RMSE值较低,是6种模型中建模效果最佳的。因此综合比较,选用CARS-MLR模型为最优模型。

表8 不同特征波长的肌细胞中SOD酶活力定量分析 MLR模型Table 8 MLR model of SOD enzyme activity in cells with different characteristic wavelengths

2.5.4 全波段与最优特征波长模型比较 由表9得出,GA法的PLSR模型和PCR模型相比,二者特征波长数相同,但前者模型性能参数较好,拥有较高的R值和较低的RMSE值;CARS模型的R值为四种模型中最高,RMSE值最小,说明模型的校正能力和预测能力均为最好;综合各个参数,和全波段所建立的PLSR模型相比,CARS-MLR模型的各个参数均有所提高,说明其模型代表全波段建模是具有可行性的。CARS-MLR模型的结果见图5。

表9 全波段与特征波长模型结果比较Table 9 Comparison of the results of full band and characteristic band models

图4 CARS-MLR建模结果Fig.4 CARS-MLR modeling results注:a:CARS-MLR光谱校正模型; b:CARS-MLR光谱预测模型。

3 结论

针对可见显微高光谱检测灵敏度高,放大倍数大,定位准确等优势,结合化学计量学方法,对滩羊肉肌细胞中超氧化物歧化酶活力进行检测并建立相关模型。选择380~980 nm波段采集223个显微样本图像,对原始数据进行异常值剔除及样本的划分,剔除11个异常值,采用RS(3∶1)法进行样本划分;预处理后选定MSC为最优方法;应用GA、IRF、BiPLS等6种方法提取特征波长;建立并分析全波段和基于特征波长的PLSR、PCR、MLR预测模型。对比多种预测模型,得出CARS-MLR最优,GA-PLSR、全波段的PLSR次之,GA-PCR最低。结果表明,利用CARS提取特征波长建立的MLR模型代表全波段建模具有可行性,这为显微高光谱成像技术在滩羊肉肌细胞内超氧化物歧化酶活力的快速检测提供借鉴。

猜你喜欢
波长校正预处理
求解奇异线性系统的右预处理MINRES 方法
杯中“日出”
高COD二噻烷生产废水预处理研究
劉光第《南旋記》校正
基于MR衰减校正出现的PET/MR常见伪影类型
在Lightroom中校正镜头与透视畸变
基于预处理MUSIC算法的分布式阵列DOA估计
机内校正
基于频域分析方法的轨道高低不平顺敏感波长的研究
日本研发出可完全覆盖可见光波长的LED光源