基于超高效液相色谱-高分辨质谱的白酒基酒等级判别

2019-05-09 06:16孙宗保吴建峰邹小波唐群勇霍玲玲
中国酿造 2019年4期
关键词:基酒识别率质谱

孙宗保,周 轩,吴建峰*,邹小波,孙 莹,唐群勇,霍玲玲

(1.江苏大学 食品与生物工程学院,江苏 镇江 212013;2.江苏今世缘酒业股份有限公司,江苏 淮安 223411;3.江苏大学 农业工程研究院,江苏 镇江 212013)

白酒在我国历史悠久,在人们的生活中有着无可替代的地位,不同等级白酒的口感、风味及价格都相差甚异。白酒基酒的品质和等级决定了成品酒的质量和等级,不同等级的基酒可以勾兑出不同风格、不同口感和不同等级的成品酒。同时准确判别白酒基酒等级也是白酒分级储藏的主要依据。因此,白酒基酒等级的准确评判至关重要。如今部分企业对白酒基酒质量等级的鉴定仍主要依靠人工感官评定,但是人工感官评定存在着一定的个体差异性、不稳定性和局限性,由主观因素导致的评价标准不统一,使得不同等级产品间的差异难以量化。因此,发展一种快速有效的白酒基酒等级和品质评价技术显得尤为必要。

目前,白酒质量等级的研究主要采用近红外光谱[1]、荧光光谱[2]、气相色谱-质谱联用[3]、传感技术等。光谱法检测成本低,易操作,但灵敏度欠佳;电子鼻用传感器阵列取代了人工嗅觉,但单一性强,且对环境温度敏感[4];气相色谱-质谱选择性好,应用广泛,但白酒微量成分众多,普通的质量分析器无法检测到痕量物质。近年来,质谱技术发展迅速,逐步应用到白酒研究中,如程平言等[5-6]采用顶空固相微萃取与质谱(headspace-solid phase microextractionmass spectrometry,HS-SPME-MS)联用技术结合支持向量机(support vector machine,SVM)、偏最小二乘-判别分析(partial least squares-discriminant analysis,PLS-DA)、逐步判别分析(stepwise linear discriminant analysis,SLDA)对浓香型和清香型白酒等级进行鉴定。尤其是具有高分辨率、高灵敏度的四级杆-静电场轨道阱Q-Exactive台式质谱仪,与超高效液相色谱(ultra-high performance liquid chromatography,UPLC)结合,能快速采集数据并精确测定质量数,被广泛应用于食品成分和品质的检测研究[7-9],如真实性评估、农药残留、生物毒素[10-12]等。在酒精类饮品中也逐步得到推广和使用[13-15],特别是在白酒品质检测方面,取得了很好的效果,如穆蕾等[16]采用高分辨质谱法鉴定出馥郁香型白酒中73种微量成分;ZHAO X R等[17]采用超高效液相色谱和高分辨质谱建立了白酒等发酵液中氨基甲酸乙酯的检测方法;CHEN D W等[18]采用高分辨质谱建立了一种简便、快速检测白酒中了17种邻苯二甲酸酯的方法。此外在白酒香型鉴定上也得到很好地应用,如程明川等[19]采用Orbitrap高分辨质谱与代谢组学分析,通过主成分分析(principal component analysis,PCA)降维处理对3种香型白酒成功进行鉴别。可以看出高分辨质谱对白酒成分及品质安全检测具有高效快捷的效果,但是对白酒等级的研究鲜有报道。白酒中挥发性成分众多,细微的变化也能使白酒口感风味产生差异,因此本研究从白酒挥发性成分出发,采用超高效液相色谱(UPLC)与基于Orbitrap高分辨质谱(high resolution mass spectrometry,HR-MS)技术联用,经组学分析软件SIEVE筛选处理,使用多种化学计量学方法对不同等级浓香型白酒基酒进行鉴别,并比较不同模型的识别效果,以期建立一种客观、准确的白酒基酒等级鉴别方法。

1 材料与方法

1.1 材料与试剂

浓香型白酒基酒:由江苏今世缘酒业股份有限公司提供,公司专业感官评定人员根据感官评定标准和流程将车间工人初步分级的白酒基酒进行感官品评分级,试验最终选取由专业感官评定人员确定的一级好、一级差、二级好、二级差基酒各30个样本(共120个)。甲醇、甲酸(均为色谱纯):国药集团化学试剂有限公司;甲酸铵(色谱纯):美国Sigma公司;娃哈哈纯净水:杭州娃哈哈集团有限公司。

1.2 仪器与设备

Ultimate 3000超高效液相色谱:美国Dionex公司;四级杆-静电场轨道阱高分辨质谱仪:美国Thermo Scientific公司;KQ-300DE超声清洗器:昆山市超声仪器有限公司;Milli-Q Advantage A10超纯水系统:美国Millipore公司;AR224CN电子天平:奥豪斯仪器(上海)有限公司。

1.3 方法

1.3.1 样品准备

样品经0.22 μm的滤膜过滤后直接进样。

1.3.2 液相色谱条件

色谱柱为Hypersil GOLD C8(100 mm×2.1 mm,3 μm);流动相组成:水相(W)为5 mmol/L甲酸铵以及0.1%甲酸水溶液,有机相(M)为5 mmol/L甲酸铵以及0.1%甲酸甲醇溶液;进样量为10 μL。梯度洗脱条件如表1所示。

表1 梯度洗脱条件Table 1 Gradient elution conditions

1.3.3 质谱扫描参数

表2 白酒基酒分析质谱扫描参数Table 2 Scan parameters of base liquor ofBaijiuby mass spectrum

1.3.4 数据处理与分析

选择正负离子切换采集数据,数据采用SIEVE组学分析软件对白酒组分进行提取、过滤(P<0.05)后,运用Matlab 2009a(Math works Co,USA)软件进行处理,分别采用主成分分析(PCA)、线性判别分析(LDA)、支持向量机(SVM)以及反向传播神经网络(back propagation-artificial neural network,BP-ANN)等化学计量学方法对不同等级白酒基酒进行建模分析。

2 结果与分析

2.1 数据重现性

为了保证数据的重现性,本实验在进样过程中穿插了质量控制(quality contral,QC)样品,考察系统的稳定性。在整个进样周期内,以一级好酒样本中某一化合物为例,其保留时间(retention time,RT)偏差应在2 s以内,响应值的相对标准偏差(relative standard deviation,RSD)在10%左右,质量测量精度偏差<10-6。采用外标法进行校正后,结果证明系统有良好的重现性、稳定性和较高的质量精度,一级好酒样本色谱图见图1。

图1 不同定性方法对一级好酒样本GC-MS分析总离子流色谱图Fig.1 TIC of first grade wine sample with different qualitative methods by GC-MS

2.2 不同等级白酒的识别结果

从四种不同等级白酒基酒120个样本中,随机选取总样本的2/3(80个)作为训练集,余下的1/3样本(40个)作为预测集。经SIEVE软件筛选分析后得到309个化合物,以不同样本中309个化合物的峰面积组成数据矩阵,采用主成分分析(PCA)、线性判别分析(LDA)、支持向量机(SVM)以及反向传播神经网络(BP-ANN)等化学计量学方法对4种不同等级的白酒进行区分。

2.2.1 主成分分析(PCA)

全部化合物的三维主成分空间分布图见图2。由图2可知,其中第一主成分(the first principal component,PC1)、第二主成分(PC2)和第三主成分(PC3)的方差贡献率分别为86.59%、3.05%、2.58%,累积方差贡献率为92.22%,在保留大部分信息的同时,也反应了化合物在原始变量空间中的分布,并在多维空间将不同等级白酒的差异可视化。从图2可以看出,四种等级的白酒在该得分图中分类趋势较为明显,说明这四种等级的白酒有一定的差异性。但是从PCA分析结果来看,不同等级样本间仍然存在一定的交叉重叠,需要进一步运用模式识别方法将其区分开。

图2 白酒样本三维主成分得分图Fig.2 Score plot of 3-dimension principal components of Baijiusamples

2.2.2 LDA、SVM和BP-ANN分析

不同等级白酒全部化合物的LDA二维得分图见图3。由图3可知,其第一判别因子和第二判别因子的贡献率分别为85.48%和8.64%,累计贡献率为94.32%。四个等级白酒各居一个象限,除个别样本外,聚类现象明显,能很好地区分开。随着主成分个数的改变,LDA的识别率也不同,识别率的变化情况见表3。可以看出,随着主成分数的增加,LDA模型训练和预测的识别率都逐渐增加,当主成分达到13时,模型准确率最高,训练集识别率为91.25%,错误识别7个样本,测试集识别率为90.00%,4个样本被预测错误,结果表明,所建立的LDA模型对白酒基酒等级判别有较好的识别效果。

图3 白酒样本线性判别分析二维得分图Fig.3 Score plot of 2-dimension ofBaijiusamples analysis by LDA

表3 LDA、SVM、BP-ANN在不同主成分下训练和测试的结果Table 3 Discriminating results of training set and test set of LDA,SVM and BP-ANN under different principal components

支持向量机(SVM)以结构风险最小化为原则建立模型,能兼顾经验风险与置信区间这两个实际风险因素,最终训练得到有良好泛化性的模型[20]。试验中,将训练和预测时的误判数作为考察模型优劣的一个指标,从表3可以看出,和LDA模型的识别结果相似,当主成分数为1和2时,训练集和测试集识别率均不高,样本误判数20左右;随着主成分数的增加,训练集和测试集的识别率都逐渐上升,当主成分数达到15时,识别率最高分别为100%和97.50%,此时主成分的累积贡献率为98.64%,训练时模型完全正确,预测时模型误判数1个。

在建立反向传播神经网络模型(BP-ANN)过程中,以响应信号的识别率作为检验模型的条件[21],通过比较多次试验结果,对BP-ANN模型的各个参数进行优化。经反复训练后各参数最终确定为:目标误差0.001,学习速率0.1,动量因子0.7,网络学习次数1 000次[22]。训练结果从表3可以看出,主成分数为1时,由于其方差贡献率较小,所解释的样本信息较少,因此训练集和测试集识别率不高,所建模型效果较差。随着主成分数不断增加,训练集识别正确率不断提高,当主成分数为8时,训练集与测试集的识别正确率均达到100%,无错误识别样本;随着主成分数继续增加,训练集模型的识别正确率又略有下降,但依然在97.00%以上,最多错误识别2个样本。

2.2.3 不同识别模式分析结果的比较

将不同等级白酒基酒在主成分分析(PCA)、线性判别分析(LDA)、支持向量机(SVM)和反向传播神经网络(BP-ANN)等多种模式下的最佳识别结果进行比较,其中PCA区分效果较好,前3个主成分解释了白酒化合物92.22%的信息。LDA、SVM和BP-ANN分别在主成分数为13、15和8时得到最佳识别效果。三种识别模型中,BP-ANN的识别效果最好,训练集和测试集识别率均为100%,预测性能最佳;其次是支持向量机,训练集和测试集识别率分别高达100%和97.50%;LDA训练集和测试集识别效果要略差于这两种非线性分析方法,但训练集和测试集识别正确率也分别达到91.25%和90%。原因可能是不同等级白酒中的挥发性成分之间存在着复杂的非线性关系,这恰好是适合BP-ANN处理的模型问题,因而BP-ANN要优于LDA分析结果,此外,BP-ANN能够解决SVM建模过程中过拟合的缺点[23]。总的来说,四种方法对不同等级白酒基酒中挥发性物质的细微差异均得到较好的识别效果,训练集和测试集的最佳判别率均在90.00%以上,因此,化学计量学与UPLC-QExactive-MS技术相结合能快速有效鉴别不同等级浓香型白酒基酒。

3 结论

采用UPLC-Q-Exactive-MS结合化学计量学方法判别不同等级白酒基酒。经组学分析得到309种化合物后,分别利用PCA、LDA、SVM和BP-ANN四种方法从挥发性成分的角度对白酒基酒等级进行判别、分析。结果表明,PCA区分效果较好,前3个主成分的累计贡献率达92.22%,另外三种模式识别方法均达到较好的识别效果,训练集和测试集的最佳识别率均在90%以上,其中BP-ANN在主成分数为8时,识别效果最优,其训练集和测试集识别正确率均达到100%。实验证明,UPLC-Q-Exactive-MS结合化学计量学分析方法能根据白酒基酒中挥发性成分的差异实现等级的有效判别,为浓香型白酒基酒质量等级的划分提供一定指导作用。

猜你喜欢
基酒识别率质谱
临床医学质谱检验技术质量管理研究
气相色谱质谱联用仪在农残检测中的应用及维护
基于两种质谱技术检测蛋白酶酶切位点的方法
那些外购基酒的白酒企业
2021年茅台酒基酒生产目标发布
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
顶空—固相微萃取—全二维气相色谱—飞行时间质谱测定水中短链氯化石蜡
档案数字化过程中OCR技术的应用分析
贴上“绿色”标签的豫坡老基酒