荧光光谱结合支持向量机测定食用色素纯度

2016-06-05 14:58陈国庆朱焯炜徐瑞煜
光谱学与光谱分析 2016年12期
关键词:胭脂红色素食用

张 毅、陈国庆*、朱 纯、朱焯炜、徐瑞煜

1. 江南大学理学院、江苏 无锡 214122 2. 江苏省轻工光电工程技术研究中心、江苏 无锡 214000

荧光光谱结合支持向量机测定食用色素纯度

张 毅1,2、陈国庆1,2*、朱 纯1,2、朱焯炜1,2、徐瑞煜1,2

1. 江南大学理学院、江苏 无锡 214122 2. 江苏省轻工光电工程技术研究中心、江苏 无锡 214000

采用一种由原点矩法改造所得的特征压缩算法对荧光光谱数据进行预处理、将处理后的数据与加权最小二乘支持向量机(WLS-SVM)算法结合、建立鲁棒回归模型、用以预测实际食用色素粉末的纯度。以亮蓝和胭脂红这2种色素为例论述该方法对实际食用色素粉末纯度的预测效果。首先、利用FLS920荧光光谱仪测量获得两种色素的标准样本和实际样本在最佳激发波长下的荧光发射光谱数据、利用由原点矩法改造所得的特征压缩算法对获取的荧光光谱数据进行压缩和变换、一方面缩短了算法的运算时间、另一方面也提高了模型的预测精度。将预处理后的荧光光谱数据输入加权最小二乘支持向量机中建立浓度预测模型、该模型对亮蓝、胭脂红实际样本溶液给出的预测光谱与它们的实测光谱吻合程度好、半高峰宽区间内的平均决定系数分别为0.662和0.931。所有亮蓝、胭脂红溶液的预测浓度和标称浓度之间具有良好的线性关系、相关系数分别为0.997和0.992。由此通过多项式拟合得到的亮蓝、胭脂红粉末的预测纯度分别为61.0%和72.3%。

光谱学; 合成食用色素; 纯度软测量; 加权最小二乘支持向量机

引 言

食品安全问题逐渐成为全社会关注的焦点。目前我国食品中添加食用色素的行为非常普遍。食用色素又称着色剂、是以调节食品色泽为主要目的的一类食品添加剂、一直被广泛的应用于食品工业及医药和化妆品生产。食用色素分合成色素和天然色素两种、其中、合成食用色素因色泽鲜艳、着色力强、价格低廉等特点而被广泛使用[1]。但是许多合成食用色素有一定毒性、如胭脂红、诱惑红等色素超标摄入、会有致畸、致癌的可能性[2]。我国对合成食用色素使用有严格的用量和用法规定、但仍有不少商家为了赢利、不管消费者的健康、无视有关法规滥加滥用。即使某一种食品中色素含量是合格的、但若消费者在生活中大量食用多种含有同样色素的食品、仍然有可能导致摄入的色素总量超标、给健康带来危害。因此在对合成食用色素使用的监管中、其含量的测定就显得尤为重要。

目前检测食用色素含量的方法主要有:高效液相色谱法[3-6]、毛细管电泳法[7]、示波极谱法[8]等、这些方法都有各自的优势、但也存在操作繁琐、检测耗时、检测成本高、结果重现性差等缺点。因此、有必要寻找一种可靠、便捷的测定合成色素含量的方法、给食品行业中合成食用色素的监管提供参考。

荧光光谱技术由于检测成本低、灵敏度高、对样本无损、得到广大学者的认可[9-10]。又因为所有合成色素均为荧光物质、它们在短波长光激发下,均能产生强的或较强的荧光[11]、所以本文利用该技术对合成色素进行定量分析。但光谱仪获取的荧光光谱数据的数据量往往较大、这不仅会增加回归算法的运算时间而且会影响回归算法的预测精度。因此本文利用由原点矩法改进所得的特征压缩算法先对原始光谱数据进行降维处理。同时考虑到荧光光谱仪激发光光强存在正常的无序抖动现象、导致被测样品的荧光强度不够稳定、可能会出现离群点。相关文献[12-15]的研究结果表明离群点对预测模型的精度有很大影响、特别是小样本建模问题、这种影响尤为突出。因此本文采用加权最小二乘支持向量机(weighted least squares support vector machine、WLS-SVM)[16]算法对降维后的数据进行回归建模、该算法可以增强预测模型的鲁棒性、其在荧光光谱检测领域的应用鲜见报道。用上述方法对某糖果厂实际生产中使用的2种合成食用色素粉末的纯度进行预测、取得了较为满意的预测效果。

1 算法原理

1.1 基于WLS-SVM的回归算法[16]

WLS-SVM是由LS-SVM发展而来的。对于一个训练数据集{(x1,y1),(x2,y2),…,(xN,yN)}、其中xi∈Rn,yi∈R、基于LS-SVM的回归算法[17-19]主要是通过非线性变换将训练样本集映射到高维特征空间、然后在高维空间进行线性回归、最后映射回原空间完成输入空间的回归估计、其线性回归函数可表示为

g(x)=wTφ(x)+b

(1)

式中φ(x)为核空间映射函数、w为权向量、b为偏差。

在基于LS-SVM的回归算法中,将回归问题转化为二次优化问题

使得

yi=wTφ(xi)+b+ei,i=1,2,…,N

(2)

式中J(w,e)为目标函数、γ为惩罚系数、其值的大小决定了对误差的惩罚力度、ei为松弛变量。应用Lagrange法可以将式(2)的二次优化问题化简为求解线性方程组问题、最终可得基于LS-SVM的回归函数为

(3)

其中α=[α1; …;αN]为Lagrange乘子向量、k(·,·)为满足Mercer条件的核函数。

但对于样本中离群点、基于LS-SVM的回归算法所采用的误差平方和评价函数会导致不稳健的预测结果。针对此问题、在基于LS-SVM的回归算法的基础上、用权值因子vi对每个样本的松弛变量ei进行加权就能得到稳健的预测结果、这就是基于WLS-SVM的回归算法。加权处理后、优化问题变为

使得

(4)

(5)

表1 WLS-SVM算法中常用的权值因子函数

1.2 a/b-荧光期望法

本文对原点矩法(属于三维荧光光谱特征参量法[21])进行改造得到了一种新的特征压缩方法、将其命名为:a/b-荧光期望法。该方法对某一样本数为N的样本集的二维荧光光谱数据集(本文所用的二维荧光光谱数据为最佳激发波长下的发射光谱)作如下处理:

(2)挑选出第i个样本的发射光谱中荧光强度大于等于a/b峰高(a/b为0~1之间的分数)的所有数据点(每个数据点都含有发射波长em和该发射波长下的荧光强度Intensity(em)这两个信息)、构成数集Di,a/b; 将区间[Di,a/b中最小的em、Di,a/b中最大的em]称为第i个样本的a/b-标尺、记作Ri,a/b、i=1,2,…,N。

(2)选取N个样本的a/b-标尺的交集作为整个样本集的a/b-标尺、记作Ra/b。

1.3 决定系数

在回归分析中、决定系数是判断模型拟合效果的重要指标。其计算公式为

(6)

2 实验与结果分析

2.1 仪器与试样

实验仪器为英国EdinburghFLS920荧光光谱仪、梅特勒AB-135S电子天平、Thermo移液枪。

试样为符合国家计量标准的亮蓝溶液标准物质(GBW(E)100162)、胭脂红溶液标准物质(GBW(E)100161)(浓度均为1mg·mL-1); 某糖果厂实际生产中使用的合成食用色素粉末:亮蓝、胭脂红。

2.2 方法

以超纯水作为溶剂将亮蓝标准溶液和胭脂红标准溶液按表2所示的浓度各配制出31个样本、分别记作亮蓝标准样本集和胭脂红标准样本集。

表2 标准样本的浓度

假设合成食用色素粉末的纯度为100%、用电子天平分别称取2种色素粉末适量、记录下数值。用超纯水配制出标称浓度为100 μg·mL-1的亮蓝实际溶液和胭脂红实际溶液、将它们按表3所示的标称浓度各配制出10个样本、分别记作亮蓝实际样本集和胭脂红实际样本集。

表3 实际样本的浓度

从4个样本集中各取一个样本、分别测量它们的三维荧光光谱、2种色素标准样本的荧光光谱特征参数见表4。为了提高光谱数据采集和光谱数据分析处理的效率、按照表5所示的荧光光谱仪测量参数对2种色素标准样本和实际样本进行二维荧光光谱的测量、每个样本测量三次取平均值、4个样本集的二维荧光光谱如图1所示。

表4 荧光光谱的特征参数

表5 荧光光谱仪测量参数

2.3 基于WLS-SVM算法对合成食用色素纯度的预测

2.3.1 训练样本集的选取

为了训练用于预测各实际样本浓度的回归模型、将标准样本集作为训练样本集。并构造数据集{(x1,y1),(x2,y2),…,(x31,y31)}、其中xi为标准样本集中第i样本的二维荧光光谱数据、yi为第i标准样本的浓度。

2.3.2 训练样本集数据的预处理

图1 四个样本集的二维荧光光谱图

2.3.3 基于WLS-SVM的鲁棒回归模型的建立

文中基于WLS-SVM的回归模型采用的核函数是径向基(RBF)核函数; 权值函数选用Hampel、该权值函数的参数设置如下:c1=2.5和c2=3; 采用k-fold交叉验证法确定模型系数、k设为3。同时将训练数据集输入回归模型对其进行训练、多次迭代后得到鲁棒回归模型。

2.3.4 对合成食用色素粉末纯度的预测

沿用亮蓝(胭脂红)标准样本集的3/4-标尺计算出10个亮蓝(胭脂红)实际样本的3/4-荧光期望、构成预测数据集输入鲁棒回归模型、对10个亮蓝(胭脂红)实际样本溶液的浓度预测结果如表6所示。

表6 实际样本的预测浓度

图2 使用本文方法的预测效果(亮蓝实际样本)

图3 使用本文方法的预测效果(脂胭红实际样本)

将浓度与实际样本预测浓度相同的标准样本的二维荧光光谱称为该实际样本的预测光谱。由于预测浓度与标准样本集中31个浓度接近的实际样本个数有限、只能从亮蓝(胭脂红)实际样本集中选择个别样本、比较它们的实测光谱和预测光谱、两种光谱的比较效果如图2(图3)所示。

由上述预测效果图可知、实测谱线和预测谱线吻合程度较好。引入曲线吻合程度的评价参数对谱线在3/4-标尺和1/2-标尺(即半高峰宽区间)上的吻合程度进行评价、在3/4-标尺上的评价参数表征了峰值点附近谱线的吻合程度、可以反映局部细节的预测效果; 在1/2-标尺上的评价参数表征了峰腰以上谱线的吻合程度、可以反映宏观整体的预测效果。必须同时考察这两个标尺上的评价参数才能客观、真实地反映谱线的吻合程度。评价结果见表7。表中亮蓝(胭脂红)实际样本在3/4-标尺、1/2-标尺上的平均决定系数分别为:0.530、0.662(0.948、0.931)、而且由表7中的平均相对误差稳定、由此说明由本文的方法给出的预测光谱和实测光谱吻合程度较好、即所建的鲁棒回归模型的预测结果可靠。

表7 实际光谱和预测光谱在3/4-标尺和1/2-标尺上的吻合程度的评价结果

对所有的亮蓝(胭脂红)实际样本溶液的预测浓度和标称浓度进行一次多项式拟合。选用的拟合函数为:F(x)=p1x+p2、由于当假定浓度为0时、真实浓度必为0、所以该真实浓度和标称浓度之间的函数关系必经过原点、所以在拟合时将p2设为0。拟合结果为亮蓝:F(x)=p1x+p2、p1=0.610 1、p2=0、p1的95%置信区间(0.595 4,0.624 8); 胭脂红:F(x)=p1x+p2、p1=0.722 5、p2=0、p1的95%置信区间(0.695 5,0.749 5)。图4为拟合效果、拟合优度见表8。

图4 拟合结果

由表8可知、亮蓝、胭脂红实际样本溶液的预测浓度和标称浓度的相关系数分别为0.997和0.992、说明两种色素的预测浓度和标称浓度之间具有良好的线性关系、由此说明本文的方法可以有效的预测合成食用色素粉末的纯度。用该方法对亮蓝、胭脂红合成食用色素粉末的预测纯度分别为:61.0%和72.3%。

表8 拟合优度

3 结 论

为了减小样本采集过程中可能引入的离群点对回归模型预测精度的影响、本文采用了WLS-SVM算法来构建回归模型。为了进一步的提高回归模型的预测精度和处理数据的效率、本文采用了一种由原点矩法改造所得的特征压缩方法—a/b-荧光期望法。利用荧光光谱数据结合a/b-荧光期望法、WLS-SVM算法所建的鲁棒回归模型对亮蓝、胭脂红实际样本溶液的浓度预测准确、预测谱线和实测谱线的吻合程度好、半高峰宽区间内的平均决定系数分别为0.662和0.931。而且所有的亮蓝、胭脂红实际样本的预测浓度和标称浓度之间具有良好的线性拟关系、相关系数分别为0.997、0.992。由此说明该方法可对某糖果厂实际生产中所使用的亮蓝、胭脂红合成食用色素粉末的纯度给出可靠的预测、预测纯度分别为61.0%和72.3%。该方法操作简单、成本低、测量周期短、测量结果可靠。可将该方法应用于对食品中合成食用色素的含量测定、为食品行业中合成食用色素的监管提供参考。

[1] CHEN Guo-qing(陈国庆). Jiangnan University Doctoral Dissertation(江南大学博士论文),2010:23.

[2] LI Run,CHEN Guo-qing,et al(李 润、陈国庆、等). Spectroscopy and Spectral Analysis(光谱学与光谱分析),2014、34(1):111.

[3] Li W J,Zhou X,Tong S S,et al. Talanta,2013、(105):386.

[4] NING Shang-yong、GAO-Jie,et al(宁尚勇,高 洁、等). Chinese Journal of Analysis Laboratory(分析试验室),2008、(4):72.

[5] ZHANG Yu-lin,MA Jing-yuan,et al(张予林,马静远、等). Journal of Northwest A & F University·Natural Science Edition(西北农林科技大学学报·自然科学版),2011、(1):186.

[6] ZHANG Wan,WANG Tan,et al(张 婉,王 覃、等). Food Science(食品科学),2011、(4):177.

[7] Del Giovine L,Bocca A P. Food Control,2003、14(3):131.

[8] WANG Yu-tian,XU Jing,et al(王玉田,徐 婧、等). Chinese Journal of Lasers(中国激光),2014、41(12): 1215002.

[9] LIU Jing,LIU Wen-qing,et al(刘 晶,刘文清、等). Acta Optica Sinica(光学学报),2013、33(9): 0930001.

[10] SONG Xin,JI Shuang-li,et al(宋 新,纪双利,等). Chinese Journal of Food Hygiene(中国食品卫生杂志),2009、(5):422.

[11] CHEN Guo-qing(陈国庆). Jiangnan University Doctoral Dissertation(江南大学博士论文),2010: 32.

[12] Pell R J. Chemometrics and Intelligent Laboratory Systems,2000、(52):87.

[13] Daszykowski M,Kaczmarek K,Vander Heyden Y,et al. Chemometrics and Intelligent Laboratory Systems,2007、85(2):203.

[14] Mφller S F,von Frese J,Bro R. Journal of Chemometrics,2005、19(10):549.

[15] Kruger U,Zhou Y,Wang X,et al. Journal of Chemometrics,2008、22(1):1.

[16] Suykens J A K,Van Gestel T,De Brabanter J,et al. Least Squares Support Vector Machines. Singapore:World Scientific,2002. 149.

[17] Suykens J A K,De Brabanter J,Lukas L,et al. Neurocomputing,2002、48(1):85.

[18] Suykens J A K,Vandewalle J. Neural Processing Letters,1999、9(3):293.

[19] Shim J,Hwang C,Nau S. Advances in Natural Computation,2006. 157.

[20] De Brabanter K,Karsmakers P,Ojeda F,et al. LS-SVMlab Toolbox User’s Guide. ESAT-SISTA Technical Report 10-146,2010: 33.

[21] SHANG Li-ping,YANG Ren-jie(尚丽平,杨仁杰). Site Fluorescence Spectrum Technology and Application(现场荧光光谱技术及其应用). Beijing:Science Press(北京:科学出版社),2009、1(5):217.

*Corresponding author

Soft Measurement of the Purity of the Synthetic Edible Pigment Powder Using Fluorescence Spectroscopy Combined with SVM

ZHANG Yi1,2、CHEN Guo-qing1,2*,ZHU Chun1,2、ZHU Zhuo-wei1,2、XU Rui-yu1,2

1. School of Science、Jiangnan University、Wuxi 214122、China 2. Jiangsu Provincial Research Center of Light Industrial Optoelectronic Engineering and Technology、Wuxi 214000、China

The feature compression algorithm which was reformed from the original Moment method was used for the pre-processing of the fluorescence spectral data,then combined the data and the Weighted Least Squares Support Vector Machine(WLS-SVM) algorithm to establish a robust regression model,which is used for forecasting the purity of edible pigment powder. In this paper,brilliant blue and ponceau 4R served as an example to discuss the method of forecasting effect of edible pigment powder purity. The emission fluorescence spectra of two edible pigment at the optimal excitation wavelength were measured by FLS920 fluorescence spectrometer. The compression and transformation of the fluorescence spectral data was acquired by the feature compression algorithm reformed from the Original Moment method. On the one hand the feature compression algorithm shortened the operation time,on the other hand it improved the prediction accuracy of the model. Then,the concentration prediction model was established after inputting the fluorescence spectral data pre-processed into the Weighted Least Squares Support Vector Machine. The model gave anastomotic predicted spectral data with the actual experiments of the brilliant blue and ponceau 4R,and the average coefficient of determination in the half peak width was 0.700 and 0.930 respectively. There was a good linear relationship between the predicted and the nominal concentration of the brilliant blue and ponceau 4R,and the correlation coefficients were 0.997 and 0.992 respectively. It can be concluded that,the predicted concentration of the brilliant blue and ponceau 4R powder were got the results of 61.0% and 72.3% respectively.

Spectroscopy; Synthetic edible pigment; Soft measurement of purity; Weighted least squares support vector machine

Sep. 3,2015; accepted Jan. 25,2016)

2015-09-03、

2016-01-25

国家自然科学基金项目(61178032、61378037)、中央高校基本科研业务费专项资金项目(JUSRP51517)资助

张 毅、1990年生、江南大学理学院硕士研究生 e-mail:zy137927643@126.com *通讯联系人 e-mail:cgq2098@163.com

O436

A

10.3964/j.issn.1000-0593(2016)12-3978-08

猜你喜欢
胭脂红色素食用
色素热舞
“听话”的色素
冷冻食品,如何选购和食用?
胭脂红
豆制品食用指南
甜油的生产及色素控制
胭脂红示踪剂在评价压裂液返排中的应用
天然色素及红色素的研究进展
寂寞胭脂红
关于一道江苏学业水平测试题的讨论