拉曼光谱法快速测定汽油中芳烃和烯烃含量研究

2015-07-19 09:54徐贺明李建华崔建方梁逸曾

中国测试 2015年8期

关键词：曼光谱烯烃芳烃

徐贺明，李建华，崔建方，梁逸曾

（1.北京化工大学化学工程学院，北京100029；2.开滦煤化工研发中心，河北唐山063611；3.中南大学化学化工学院，湖南长沙410083）

拉曼光谱法快速测定汽油中芳烃和烯烃含量研究

徐贺明1，2，李建华2，崔建方2，梁逸曾3

（1.北京化工大学化学工程学院，北京100029；2.开滦煤化工研发中心，河北唐山063611；3.中南大学化学化工学院，湖南长沙410083）

该研究采用拉曼光谱法对汽油中的总芳烃和总烯烃含量进行直接测定，通过随机蛙跳方法选择特征波段并采用偏最小二乘法建立模型。总芳烃模型的测试集相关系数为0.985，预测均方根误差为1.08，总烯烃模型的测试集相关系数为0.942，预测均方根误差为0.78。结果表明模型相关性较好，可满足实际应用需求，为拉曼光谱在汽油成分检测中的应用奠定基础。

拉曼光谱；汽油；芳烃；烯烃；特征波段

目前汽油中芳烃和烯烃的测量多采用多维气相色谱、荧光指示剂等方法[2-3]，但是多维气相色谱法仪器价格昂贵，试验成本高，荧光指示剂法则操作复杂，分析时间长[4]。拉曼光谱分析技术具有快速、无损、重复性好等优点，而且拉曼光谱的O-H峰很弱，对C-H伸缩振动的干扰小，谱峰清晰尖锐且具有一定物理意义，能够反映组分的信息，适合于汽油的定量分析[5-8]。

拉曼光谱快速测定需先建立属性值与光谱数据的定量分析模型[9]，进而调用模型获得待测样本属性的预测值，是一种间接分析技术。但是，样本拉曼光谱不仅包含待测属性信息，同时也包含基线漂移、杂散光、干扰物质等干扰信息。因此在建立模型时，应针对待测属性寻找拉曼光谱特征区间以达到消除干扰的目的，提高分析准确度。

本文针对汽油样本的拉曼光谱，探索研究其特征波段并建立烯烃含量和芳烃含量的定量分析模型。

1 实验与方法

1.1 样本

本研究所用样本为市场上所购买的90个成品汽油，包括50个93号汽油样本和40个97号汽油样本，具有较好代表性，可满足建立模型的需求。其芳烃和烯烃含量指标由国标荧光指示剂法测定[3]。表1列出了样本测量值的统计数据。

表1 样本中芳烃和烯烃测量值的统计数据

1.2 光谱测量

本研究所用拉曼光谱仪为i-Raman激光光谱仪（必达泰克公司，美国），积分时间5 s，每个样本重复测量3次，取平均光谱。所得光谱如图1所示。

图1 汽油样本的拉曼光谱图

1.3 特征波段选择方法

汽油的拉曼光谱反映了样本的综合信息，但应注意到，只有一部分波段蕴含了待测组分的含量信息，而其他波段对预测不具有价值，甚至可能降低预测模型的精度。因此，从连续的拉曼位移空间中选出这少部分的特征波段对于建立预测模型非常重要。波段选择方法已在近红外和紫外光谱中得到了广泛应用，但在拉曼光谱中的应用还比较少；因此，本研究将一种新的基于贝叶斯理论[10-11]的随机蛙跳方法（random frog）应用于拉曼光谱的特征波段选择。

本方法的基础为逆跳马尔科夫链（reversible jump markov chain monte carlo，RJMCMC），其主要工作原理为，通过模型维数转换技术，在模型空间中构造一个马尔科夫链，链中的每个节点代表一个模型。若模型的转移概率满足详细平衡规则，则此马尔科夫链最终将收敛于一稳态分布，此稳态分布即为模型的后验分布，可采用数值方法从此后验分布中采样，获取变量选择概率，用于变量选择。沿用RJMCMC中通过维数转换进行模型采样的思想，但是采用了自主提出的基于正态分布的随机维数转换机制，使得方法容易理解而且计算简单。同时结合模型集群分析的思想，利用上述维数转换机制在模型空间中进行序贯的模型采样，得到多个模型和一伪马尔科夫链。然后统计出每个变量在这些模型中的出现概率，用于变量重要性的评价。

假定当前马尔科夫链中的模型记为（k，θk），这里k代表模型的序号，θk代表相应模型的参数，迭代次数设为N。在此条件下，RJMCMC模型可以简述如下：

1）按概率J（k→k′）建议转移到新模型Mk′。

2）计算新模型的参数θk′。

3）计算新模型Mk′的接受概率（模型比与建议比的乘积）。

通过这3步不断循环，最终得到N个模型（ki，i= 1，…，N）。每个模型的后验概率可以按下式计算：

用矩阵X（n×p）表示样本矩阵，待测属性向量用y（n×1）表示。本方法主要有3个工作步骤：1）随机产生一个含有Q个变量的初始变量集，记为V0；2）根据V0，建议一个含有Q*个变量的变量集V*，按一定的概率接受V*，并令V1=V*，如此迭代N步；3）综合分析每步产生的变量集，计算每个变量的选择频率，作为变量重要性的评价指标。在本方法中，仅迭代次数N对随机蛙跳算法有主要影响。理论上N值越大，模型采样量就越多，效果越好，但考虑到计算时间，亦不可过大。在本研究中，迭代次数设定为10 000，得到了较好的结果。

1.4 软件

本研究所用化学计量方法来自于数据分析软件Chemosolv（长沙科硕仪器有限公司，中国）和Matlab（MathWorks，USA）。

2 结果与讨论

2.1 样本的划分

建立校正模型的目的在于正确对新样本进行预测，因此待分析样品的变化必须尽可能多地纳入训练集中。为了满足上述要求，必须用有效的算法从样品中选择出一批具有代表性的训练样本。本研究采用Kenard-Stone方法[12]，从总计90个汽油样本中挑选出具有代表性的75个样本用于训练模型，15个样本用于测试模型。

2.2 拉曼光谱特征波段选择

在本研究中，以预测均方根误差（rootmean square error of prediction，RMSEP）为指标来评价模型的优劣，其计算公式如下所示：

式中：yi——测试集第i个样本的实际成分含量；

t——测试集的样本个数。

RMSEP值越小，模型计算的预测值越接近于实际值，说明模型越好。

首先不选择拉曼光谱，直接用原始光谱建立偏最小二乘校正模型，采用5折交互验证法，分别选取7个和9个PLS成分，得到芳烃和烯烃的测试集RMSEP分别为1.20和0.87。

为进一步提高预测效果，简化模型，采用本研究的方法对训练集样本进行波段选择，然后对测试集样本进行预测，所得结果如表2所示。

表2 拉曼光谱经不同预处理后PLS建模结果比较

从表中可知，不管是对芳烃还是烯烃的预测来说，选取关键的特征波段进行预测，RMSEP均有所降低，说明可以提高模型的预测精度，同时因为变量减少，模型复杂度减小，得到的模型更加简单和稳健。

选择出的特征波段见表3。为了进一步阐明选择的波段与待测属性间的关系，图2和图3分别表示了芳烃和烯烃所对应特征波段在原始光谱中的位置。分析图2可知，998～1028 cm-1对应光谱最大吸收峰，应为苯环呼吸振动以及甲苯和乙苯中C-H键的变形振动。而804～842 cm-1对应对二甲苯的特征吸收，1 372～1 410 cm-1则应为二甲苯中甲基的变形振动峰。这些特征吸收均与芳烃有着较为密切的关系[13]，因此，选取这些特征波段建立芳烃的定量预测模型，其效果好于原始光谱，预测误差降低了10%。

图2 芳烃所对应特征波段

表3 选择的拉曼位移列表

图3 烯烃所对应特征波段

结合表3和图3可知，烯烃所对应的特征波段与芳烃具有较大区别，事实上，汽油中的烯烃组成非常复杂。但本研究所选择的1655～1677 cm-1对应其特征C=C双键振动[14]。而且从结果看，特征波段所建立的模型，其预测误差减小了10.34%。

2.3 校正模型的建立

经过波段选择后，采用偏最小二乘法建立汽油中总芳烃和总烯烃含量的定量模型，其预测结果分别如图4和图5所示。从图4可知，总芳烃模型测试集相关系数为0.985，预测均方根误差为1.08，预测较为稳定可靠。同样从图5可看出，总烯烃模型的测试集相关系数为0.942，预测均方根误差为0.78。两个模型均具有较好的相关性和较低的预测误差。说明通过波段选择之后，分别选取含量所对应的特征变量来建立模型，不仅可以简化模型，减少复杂度，提高模型的建立和预测速度，同时还可以消除干扰物质对所测物质含量的影响，提高预测精度。可作为拉曼光谱定量分析中有效处理方法。

图4 芳烃含量预测值与测量值关系图

图5 烯烃含量预测值与测量值关系图

2.4 讨论

本文建立了拉曼光谱快速无损测定车用汽油中的总芳烃和总烯烃含量的方法。通过特征波段筛选，选出与总芳烃和总烯烃相关的拉曼位移来建立模型，以滤除一定的干扰信息，达到提高预测精度的目的。除了这种方法，在建立模型的方法方面进行优化，也可以起到提高预测效果的作用，如可用于非线性建模的神经网络、支持向量机等方法。但是考虑到与更加复杂的非线性模型相比，本文基于特征波段的线性模型更加简单，其过拟合风险大大降低，在实际中应用更加可靠。

3 结束语

本研究以汽油中的芳烃和烯烃含量的快速测定为研究对象，采用预处理后的拉曼光谱建立校正模型，可以实现汽油中芳烃和烯烃含量的快速检测，为拉曼光谱在汽油检测中的应用提供了重要参考。

[1]GB/T 17930—2011车用汽油[S].北京：中国质检出版社，2011.

[2]徐广通，杨玉蕊，陆婉珍.多维气相色谱快速测定汽油中的烯烃、芳烃和苯含量[J].石油炼制与化工，2003，134（3）：61-65.

[3]GB/T 11132—2002液体石油产品烃类测定法（荧光指示剂吸附法）[S].北京：中国标准出版社，2002.

[4]林艺玲.成品汽油关键成分的拉曼光谱分析[D].杭州：浙江大学，2011：136-139.

[5]陆婉珍.现代近红外光谱分析技术[M].北京：中国石化出版社，2006：77.

[6]Cooper J B，Wise K L，Welch W，et al.Comparison of Near-IR，raman，and Mid-IR spectroscopies for the determination of BTEX in petroleum fuels[J].Applied Spectroscopy，1997，51（11）：1613-1620.

[7]Vianney O S，Flavia C C，Daniella G L，et al.A comparative study of diesel analysis by FTIR，FTNIR and FT-Raman spectroscopy using PLS and artificial neural network analysis[J].Analytica Chimica Acta，2005（547）：188-196.

[8]包鑫，戴连奎.汽油多参数拉曼光谱分析仪的稳健支持向量机方法[J].仪器仪表学报，2009，30（9）：1829-1835.

[9]梁逸曾，许青松.复杂体系仪器分析-白灰黑分析体系及其多变量解析方法[M].北京：化学工业出版社，2012：42-63.

[10]Li H D，Xu Q S，Liang Y Z.Random frog：An efficient reversible jump markov chain monte carlo-like approach for variable selection with applications to gene selection and disease classification[J].Analytica Chimica Acta，2012（740）：20-26.

[11]Yun Y H，Li H D，Wood L R，et al.An efficient method of wavelength interval selection based on random frog for multivariate spectral calibration[J].Spectrochim Acta A Mol Biomol Spectrosc，2013（111）：31-36.

[12]Galvao R K H.A method for calibration and validation subset partitioning[J].Talanta，2005，67（4）：736.

[13]Hansen S B.The application of raman spectroscopy for analysis of multi-component systems[D].Copenhagen：Technical University of Denmark，2000.

[14]张华.现代有机波谱分析[M].北京：化学工业出版社，2005：336-347.

Rapid determ ination of aromatic hydrocarbon and olefin hydrocarbon content in gasoline by raman spectroscopy

XU Heming1，2，LI Jianhua2，CUI Jianfang2，LIANG Yizeng3
（1.College of Chemical Engineering，Beijing University of Chemical Technology，Beijing 100029，China；2.Coal Chemical R&D Center of Kailuan Group，Tangshan 063611，China；3.College of Chemistry and Chemical Engineering，Central South University，Changsha 410083，China）

In this paper，the Raman spectroscopy was used to determine the contents of aromatic hydrocarbon and olefin hydrocarbon in gasoline.Random Frog method was employed to select the Raman bands and the best model was established on the basis of optimized conditions.The correlation coefficients of prediction were 0.985 and 0.942 for aromatic hydrocarbon and olefin hydrocarbon，respectively.The RMSEP（Root Mean Square Error of Prediction）was 1.08 and 0.78，respectively.The results show this model has good linear correlation and adapt to the practical application demand，lay a foundation for gasoline composition detection used raman spectroscopy.

raman spectroscopy；gasoline；aromatic hydrocarbon；olefinic hydrocarbon；raman bands

A文章编号：1674-5124（2015）08-0040-04

10.11857/j.issn.1674-5124.2015.08.009

0 引言

近年来，随着汽车保有量的迅速增加，汽车运行对环境带来的污染也受到人们的关注。在汽车集中的大城市，汽车尾气排放已成为主要污染源之一，因此对汽油中芳烃和烯烃的含量限制越来越严格。我国车用汽油质量标准GB 17930——2011《车用汽油》要求车用汽油中芳烃和烯烃含量分别不能超过40%和30%[1]。

2015-01-03；

2015-03-17

国家自然科学基金项目（21275164）

徐贺明（1962-），男，高级工程师，主要从事能源化工技术及管理工作。