双波段光谱融合的猪肉多品质参数同时检测方法研究

2016-06-05 14:58王文秀彭彦昆徐田锋刘媛媛
光谱学与光谱分析 2016年12期
关键词:光谱仪波段猪肉

王文秀、彭彦昆*、徐田锋、刘媛媛,2

1. 中国农业大学工学院、国家农产品加工技术装备研发分中心、北京 100083 2. 塔里木大学机械电子化工程学院、新疆 阿拉尔 843300

双波段光谱融合的猪肉多品质参数同时检测方法研究

王文秀1、彭彦昆1*、徐田锋1、刘媛媛1,2

1. 中国农业大学工学院、国家农产品加工技术装备研发分中心、北京 100083 2. 塔里木大学机械电子化工程学院、新疆 阿拉尔 843300

在双波段可见/近红外光谱系统(350~1 100和1 000~2 500 nm)中、由于两台仪器性能有所不同、导致在波段重叠区域对同一样品测得的反射率不同、出现数据交叉现象。针对此问题、提出一种波段连接数据融合的方法、以期对两个波段的光谱进行更好的应用。首先采集60个生鲜猪肉样品表面的反射光谱信息、利用Savitzky-Golay(S-G)平滑和标准正态变量变换进行预处理、然后利用单一波段和双波段光谱数据与猪肉品质参数(颜色参数L*,a*,b*、pH和蒸煮损失率)理化值建立偏最小二乘预测模型、并分析比较。利用提出的波段融合方法对两个波段重叠区域出现的交叉进行处理、处理后的双波段光谱融合数据对参数L*,a*,b*,pH以及蒸煮损失率建模、验证集的相关系数分别为0.948 8、0.920 0、0.950 5、0.930 1和0.903 5、模型效果与未融合前相当甚至更优。采用无信息变量消除法方法进行特征变量筛选、利用优选后的特征变量建立了更为简化的模型。实验结果表明、所提出的波段融合方法能够对两个波段光谱数据实现较好的融合、利用融合后的光谱数据有利于建立更简化、性能更佳的预测模型。

可见/近红外; 品质参数; 双波段; 数据融合

引 言

猪肉是我国大部分居民肉类食物的主要来源、我国猪肉的生产消费总量在世界范围内居首位。随着消费水平的提高和对健康的日益关注、人们对猪肉的需求日趋多元化、消费者对猪肉的品质(颜色、pH、蒸煮损失率等)要求也日益提高、猪肉品质受到越来越多的关注[1]。

近红外光谱技术是近些年来迅速发展起来的一种技术。ElMasry等[2]利用近红外高光谱系统(900~1 700 nm)检测新鲜牛肉的颜色、pH以及嫩度、并对结果进行可视化处理。Su等[3]利用近红外光谱(1 000~1 800 nm)对肉中水分、脂肪和蛋白质含量进行预测、取得了较好的结果。上述研究均基于单一波段光谱信息建立模型、由于猪肉组织结构化学组成比较复杂、而单一波段波长范围较窄、因此所能反映的样品光学信息有限。目前波段范围可直接覆盖350~2 500 nm的宽波段可见/近红外光谱仪、虽然可应用于肉品检测、但是价格较贵。因此本工作搭建了双波段可见/近红外检测系统、波段范围覆盖了350~1 100 nm以及1 000~2 500 nm。由于两个波段光谱仪仪器性能不同、在1 000~1 100 nm的波段重叠区域、对于同一样品采集得到的反射率不同、两个波段的光谱数据并不连接。若是利用两个波段的光谱数据同时建模、研究如何利用好重叠区域的数据、实现重叠区域数据的融合、进而建立更加稳健的模型具有重要的意义。

针对光谱连接问题、张海云等[4]将两个波段融合区域的数据进行了加权平均、对该部分数据进行了融合。石力安等[5]在交接点处左右各取5个数据、通过偏最小二乘法求出最佳移动距离、生成连续的平滑曲线。然而、上述连接方法均是在已经获得的反射率数值基础上进行数学平均或者最小二乘平移、并没有将造成结果差异的仪器性能因素考虑进来、因此这种融合方式具有一定的局限性。针对这一问题、本工作提出一种基于光谱仪器响应的波段连接方法、对两个波段数据在重叠区进行折算、进而实现两个波段光谱数据的融合、并利用融合后的光谱数据建立偏最小二乘回归(partial least square regression,PLSR)模型、以此来验证融合方法的可靠性。

1 实验部分

1.1 材料

所用实验样品为超市购买的冷鲜猪肉背最长肌部分。将样品修整为25 mm厚的肉块后、立即用蓄冷装置运送至无损检测实验室、共选取60个样品用于后续实验分析。采集前将样品放置于空气中暴露30 min、使表面水分蒸发、同时开启仪器进行预热。光谱采集时要尽量保持外界环境条件一致、减少外界环境因素对光谱数据的影响。采集完成后、立即进行颜色参数L*(明亮度),a*(红绿方向变化),b*(黄蓝方向变化),pH和蒸煮损失率的测定。

1.2 仪器

实验所采用的可见/近红外检测系统主要由光谱仪、卤钨灯点光源(AvaLight-HAL、荷兰Avantes公司、覆盖波长350~2 500 nm、功率14 W)、三分叉光纤(FCR-7IR400-2-ME、荷兰Avantes公司)以及计算机等组成、如图1所示。其中、所用两个波段光谱仪分别是:光谱仪1(型号:AvaSpec-2048x14、荷兰Avantes公司、波长范围是350~1 100 nm)、光谱仪2(型号:AvaSpec-NIR 256-2.5、荷兰Avantes公司、波长范围是1 000~2 600 nm)。由于猪肉样品表面并不完全的平整、将光纤末端插入自行设计的光纤夹具中、通过前端5 mm的限位孔保证检测距离的一致。采集时、将光纤夹具贴在样品表面、既保证检测距离、又避免外界环境光的影响与干扰。此外、还用到精密色差仪(HP-200、上海汉谱光电科技有限公司)、pH计(METTLER TOLEDO FE20、北京连博永通科技有限公司)、水浴锅、天平等。

图1 可见/近红外光谱系统

1.3 光谱采集与理化值测定

利用上述光谱采集系统获取样品反射光谱曲线。由于样品的不均匀性、采集5个不同位置处的信息并求取平均后作为其原始光谱。然后分别利用精密色差仪和pH计测定颜色参数和pH、每个样品测定5次并求取平均。最后、对肉块称重并记录质量、密封包装后置于80 ℃水浴锅中加热、当样品中心温度为70 ℃时取出并冷却至室温、破坏包装后将肉块取出、用滤纸将表面水分吸干、记录其质量[6]。蒸煮损失率(%)计算如下

(1)

式(1)中、w1为蒸煮前样品的质量(g)、w2为蒸煮后样品的质量(g)。

1.4 光谱处理与数据分析

在建立模型之前、利用Savitzky-Golay(S-G)平滑来减弱随机噪声造成的影响、尽可能多地保留数据中的有效信息[7]。同时采用标准正态变量变换(standard normal variable transform、SNVT)的预处理方法来消除固体颗粒大小、表面散射以及光程变化对漫反射光谱的影响[8]。然后、分别利用单一波段的光谱信息和两个波段的光谱信息建立PLSR模型、并对所建模型的效果进行比较。两个波段连接后、由于数据量冗大、利用无信息变量消除法(uninformative variables elimination,UVE)对特征变量进行筛选、进而建立更加简单的模型[9-10]。UVE法的基本原理是在光谱矩阵中加入相同数量的随机变量矩阵、而后建立PLSR模型、通过系数B、来判断变量的重要程度[11]。

1.5 双波段数据融合方法

光谱仪测量到的结果是真实的光谱结果与光谱仪响应函数的卷积。由于两台光谱仪的探测器不同、光栅的量子效率不同、因此在相同波段下对于同一样品所得到的结果不相同。本研究中光谱仪1(波长350~1 100 nm)使用的是CCD探测器、分辨率为0.59 nm、光谱仪2(波长1 000~2 500 nm)使用的是InGaAs线阵探测器、分辨率为6.958 nm。两台仪器之间存在较大的差异、包括二者的探测器不同、信噪比有较大的差别等、同时这些差异对光谱造成的影响也与样品有关、因此引入了线性平移量(截距常数)和倾斜偏移量(回归系数)的概念、将两个光谱仪在重叠区域进行折算、从而实现了分辨率较高的光谱仪1对分辨率低的光谱仪2的校正、对重叠区域的数据进行了融合。

(1)对光谱进行平滑处理。由于重叠区域分别位于光谱仪1的末端和光谱仪2的前端、为了减少光谱仪热稳定引起的系统误差、先进行平滑处理。

(2)波段交接处的校正和折算。对于两个光谱仪上得到的样品反射率、由式(2)和式(3)计算得出

(2)

(3)

在光谱范围重叠区域、对每个波长下由两台仪器所测得的反射率做回归、来对该波段范围内的反射率差异进行校正

Rm,j=Rs,j×bj+cj

(4)

式(4)中、Rm和Rs为两个波段光谱仪所得到的反射率、S1和S2为样品在两个光谱仪上的强度、D1和D2为两个光谱仪所得黑参考、R1和R2为两个光谱仪的参比、Rm,j和Rs,j分别为两个光谱仪测量同一样品所得光谱矩阵Sm和Ss在第j波长处的反射率、bj为回归系数、cj为截距常数。对式(4)进行初始化、在样品为白板时、得到的反射率均为100%、因此可得式(5)—式(7)

100bj+cj=100

(5)

(6)

(7)

利用线性方程的最小二乘解、即按照残差平方和最小的原理求解、得到某一样品在整个重叠区域的斜率和截距。

(3)重叠区域校正到光谱仪1后、对光谱仪2在1 100~2 500nm范围的反射率乘上该系数、根据节点处光谱仪2与光谱仪1的差值、计算出每个样品在1 100~2 500nm波长下的偏移量。

2 结果与讨论

2.1 猪肉各品质参数理化值分析

利用Kennard-Stone算法[11]按照3∶1的比例将样品分为校正集和验证集、各品质参数的统计信息如表1所示。

表1 校正集和验证集中各品质参数的参考值

2.2 单个波段与双波段光谱建模

60个生鲜猪肉样品在两个波段的原始反射光谱曲线如图2所示。图2(a)为光谱仪1得到的曲线、图2(b)为光谱仪2得到的曲线。其中、420 nm与去氧肌红蛋白的吸收峰有关、520和560 nm与氧合肌红蛋白的吸收峰有关、1 210 nm与C—H键的二级倍频有关、1 420 nm与N—H键的一级倍频和组合频有关。对于光谱仪2、由于前端噪音较大、截取1 029 nm后的数据进行分析。

利用预处理后的单一波段光谱信息和双波段光谱信息、建立PLSR模型、结果如表2所示。此时利用两个波段的方法为将预处理后的单个波段的数据矩阵平行放在一起、形成新的光谱变量矩阵。其中、校正集相关系数和均方根误差分别用Rc和SEC表示、验证集相关系数和均方根误差分别用Rp和SEP表示。

由表2中数据可以看出、总体上基于波段1(350~1 100 nm)所建模型的效果优于波段2(1 029~2 500 nm)、尤其是颜色参数。一方面与光谱仪1的分辨率高噪音小有关、另一方面因为与颜色有关的信息主要集中在波段1。因猪肉的化学成分比较复杂、为含多种由C—H键、O—H键及N—H键组成的有机化合物、而850~950、1 100~1 225、1 300~1 420、1 650~1 800和2 200~2 450 nm与C—H键拉伸和伸缩振动相关、775~850 nm与N—H键伸缩振动相关、950~1 100、1 400~1 500以及2 000~2 200 nm与N—H键和O—H键振动伸缩相关。因此、双波段光谱数据更能提供丰富的信息来表征化学物质本身的特性、建立起来的预测模型更加准确。

图2 双波段原始光谱曲线

表2 基于单一波段和双波段光谱的建模结果

2.3 波段连接数据融合后建模

利用所提出的波段连接和数据融合的方法对原始光谱数据进行处理、处理之后的光谱曲线如图3(b)所示、未连接前原始光谱曲线如图3(a)所示。二者比较可以发现、处理后的光谱曲线较好的保留了原有的曲线形状和变化趋势、而在重叠的1 029~1 100 nm波段范围内、光谱曲线连接较好、在节点处变化平缓。基于仪器响应差异、对由此造成的同一波段不同的反射率数值进行折算、可以避免直接对数据平移进行数据融合所导致的光谱扭曲以及突然变大或减小造成的光谱急剧变化。

图3 连接前后双波段的光谱曲线

对融合后的光谱数据进行平滑和SNVT预处理后、建立PLSR模型。对各个参数建模的预测集结果如表3所示。从表3可以看出、所建立模型的性能良好、对各个参数建模结果与未融合前相当甚至更优、对重叠区域数据得到更好的应用、证明了该融合方法的可行性。利用UVE法对参数L*进行变量筛选的结果如图4所示。以图中虚线部分为界限、在虚线之外对应的变量作为有效变量用于模型建立、而虚线内对应的变量予以剔除。对参数L*,a*,b*,pH和蒸煮损失率、使用相较于原先12.65%、34.32%、23.94%、24.77%和14.00%的变量、便建立了性能相当的模型(表3)、所用变量数大大减少、简化了整个运算的过程、提高了效率。

表3 数据融合变量筛选后模型结果

图4 利用无信息变量消除方法筛选变量

3 结 论

利用双波段可见/近红外光谱系统获取了猪肉的反射光谱、进行S-G平滑和SNVT预处理后、与颜色、pH和蒸煮损失建立了基于单一波段和双波段光谱信息的PLSR模型、并进行了比较。结果表明、单一波段光谱数据建模时、光谱仪1的建模结果明显优于光谱仪2、双波段光谱数据建立模型的结果优于单一波段数据建模、这是由于双波段光谱能够提供更加充分和完整的光谱信息、以此来表征猪肉的反射特性。对于两个波段重叠区域出现的交叉、利用本研究提出的方法、计算出转换系数和偏移量后、进行两个波段数据的融合、建立PLSR模型。该方法将造成光谱差异的仪器性能这个因素考虑进来、通过不同仪器间光谱差异进行折算、实现数据融合。利用融合后的数据对参数L*,a*,b*,pH以及蒸煮损失率建模、验证集的相关系数分别为0.948 8、0.920 0、0.950 5、0.930 1和0.903 5、模型效果与未融合前相当甚至更优、可见该融合方法的可行性。采用UVE方法进行特征变量筛选、使用较少的变量便取得了性能相当或者更优的模型、不仅简化了模型、同时还提升了预测能力。

[1] Huang Qiping,Chen Quansheng,Li Huanhuan,et al. Journal of Food Engineering,2015,154:69.

[2] ElMasry G,Sun D,Allen P. Journal of Food Engineering,2012,110:127.

[3] Su Huawei,Sha Kun,Zhang Li,et al. Meat Science,2014,98:110.

[4] ZHANG Hai-yun,PENG Yan-kun,WANG Wei,et al(张海云、彭彦昆、王 伟、等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报),2013,44(4):146.

[5] SHI Li-an,GUO Hui,PENG Yan-kun,et al(石力安、郭 辉、彭彦昆、等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报),2015,46(7):203.

[6] ZHANG Lei-lei,PENG Yan-kun,LIU Yuan-yuan,et al(张雷蕾、彭彦昆、刘媛媛、等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报),2013,44(Supp. 1):159.

[7] CHU Xiao-li,YUAN Hong-fu,LU Wan-zhen(褚小立、袁洪福、陆婉珍). Progress in Chemistry(化学进展),2004,16(4):528.

[8] TIAN Kuang-da,QIU Kai-xian,LI Zu-hong,et al(田旷达、邱凯贤、李祖红、等). Spectroscopy and Spectral Analysis(光谱学与光谱分析),2014,34(12):3262.

[9] LI Qian-qian,TIAN Kuang-da,LI Zu-hong,et al(李倩倩、田旷达、李祖红、等). Chinese Journal of Analytical Chemistry(分析化学),2013,41(6):917.

[10] CHEN Bin,CHEN Dan(陈 斌、陈 蛋). Spectrum Instrument and Analysis(光谱仪器与分析),2005,25(4):26.

[11] Porep Jan U,Kammerer Dietmar R,Carle Reinhold. Trends in Food Science & Technology,2015,46:211.

*Corresponding author

Simultaneous Detection of Multiple Quality Parameters of Pork Based on Fused Dual Band Spectral

WANG Wen-xiu1,PENG Yan-kun1*,XU Tian-feng1,LIU Yuan-yuan1,2

1. National Research and Development Center for Agro-processing Equipment,College of Engineering,China Agricultural University,Beijing 100083,China 2. College of Mechanic and Electrical Engineering,Tarim University,Alar 843300,China

For dual band visible/near infrared spectroscopy system (350~1 100 and 1 000~2 500 nm),there exsits a band overlap and for the same sample the reflectivity data were unlike due to the performance difference between instruments. A band connection and data fusion method was proposed in this paper to make better use of the dual-band data. A dual-band visible/near-infrared spectroscopy system was built in the study to collect 60 pork samples’ reflectance spectra. The reflectance spectra of samples were performed with pretreatment methods of Savitzky-Golay (S-G) and standard normal variable transform to eliminate the spectral noise. Then partial least squares regression (PLSR) prediction models of pork quality attributes (color,pH and cooking loss) based on single-band spectrum and dual-band spectrum were established,respectively. For the cross of two band overlap,the data were connected and integrated using the method put forward in this paper and then PLSR models were established based on the integrated data. The PLSR model yielded prediction result with correlation coefficient of validation (Rp) of 0.948 8,0.920 0,0.950 5,0.930 1 and 0.903 5 for L*,a*,b*,pH value and cooking loss,respectively. To simplify the model,uninformative variables elimination (UVE) was employed to select characteristic variables. The experimental results show that the proposed method was able to achieve a better fusion of the two band spectral data,and it was good for the establishment of a more simplified and better prediction model.

Visble/near infrared; Quality parameters; Dual band; Data fusion

Dec. 23,2015; accepted Apr. 3,2016)

2015-12-23、

2016-04-03

国家重点研发计划项目(2016YFD0400905)资助

王文秀、1989年生、中国农业大学工学院硕博连读研究生 e-mail:Godlovexiu@163.com *通讯联系人 e-mail:ypeng@cau.edu.cn

O433

A

10.3964/j.issn.1000-0593(2016)12-4001-05

猜你喜欢
光谱仪波段猪肉
最佳波段组合的典型地物信息提取
结合三反消像散光学系统的中阶梯光栅光谱仪设计
猪肉将降到白菜价
近期猪肉价格上涨动力减弱
猪肉价格要回归正常了?
视野中的光谱
——多功能光谱仪
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
猪肉卷
光谱仪告诉你苹果熟不熟