基于M-QSPR的乙醇-汽油参比燃料混合物辛烷值的理论预测

2018-03-05 05:46张彭非蒋军成
石油学报(石油加工) 2018年1期
关键词:描述符辛烷值混合物

张彭非, 潘 勇, 管 进, 蒋军成

(南京工业大学 安全科学与工程学院, 江苏 南京 210009)

近年来,乙醇汽油的使用量快速增长。美国能源独立和安全法案强制要求,美国可再生能源的使用量要从2007年的90亿加仑(1美制加仑约3.79升)上升到2020年的360亿加仑[1]。发动机爆震现象是由火焰前锋未燃烧的燃料与空气混合物的自燃引起的[2-3],是制约火花发动机达到更高热效率的一个重要因素,这种自燃现象产生的压力波会对发动机硬件造成严重损坏[4]。辛烷值是衡量包括乙醇汽油在内的汽油产品抗爆性能的重要参数,辛烷值越高,抗爆震性越强。因此,研究乙醇汽油的辛烷值,对其安全使用和储存具有重要意义。

通过实验测定是目前获取汽油辛烷值数据的最有效方法。根据ASTM D2699[5]和ASTM D2700[6]的规定,辛烷值分为研究法辛烷值(RON)和马达法辛烷值(MON)两种。通过实验测定来改善调试汽油样品的辛烷值从而确定其最佳配比,不仅需要昂贵的实验仪器及设备,还需要花费大量的时间及试剂样品[7]。因此,有必要开展汽油辛烷值的理论预测研究,建立可靠的理论预测模型,弥补实验方法的缺陷与不足。

目前,分析化学法是文献上预测汽油辛烷值的常见方法。Ghosh等[8]、Lugo等[9]和Albahri等[10]通过色谱分析法来预测汽油辛烷值,平均误差值约为4~7。Kardamakis等[11]、王宗明等[12]、史月华等[13]则通过近红外光谱法对汽油辛烷值进行预测研究。分析化学法的缺陷在于同样需要用到相应分析测试仪器,其运转、维护费用较高,且耗时耗力。因此,采用各种理论算法来建立汽油辛烷值的预测模型受到广泛关注。

定量结构-性质相关性(Quantitative structure-property relationship, QSPR)研究是一种根据分子结构有效预测有机物理化性质的理论方法。目前,相关研究者已应用该方法对单一汽油组分的辛烷值进行了预测研究[14-17]。然而,文献中针对含乙醇汽油混合体系的混合物定量结构-性质相关性(M-QSPR)的研究鲜见。

在本研究中,从分子结构角度出发,以乙醇-汽油参比燃料混合物为研究对象,针对其研究法辛烷值开展混合体系的M-QSPR研究,建立相应的理论预测模型,揭示相应的特征结构因素及其影响规律,为工程上提供一种根据分子结构快速预测乙醇-汽油参比燃料混合物辛烷值的新方法。

1 实验部分

1.1 实验样本及样本集划分

乙醇在改善发动机爆震现象方面作用明显[18-20]。与传统汽油相比,乙醇汽油具有明显更高的辛烷值。按照我国的国家标准,乙醇汽油是用普通汽油与燃料乙醇调和而成。在目前国内外相关研究中,通常以正参比燃料(异辛烷与正庚烷的混合物)作为汽油产品的替代燃料来测定或研究汽油的辛烷值。在此基础上,笔者对实际乙醇汽油体系进行简化,针对乙醇与汽油参比燃料的混合物(即乙醇-异辛烷-正庚烷三元混合物)开展相关研究。

在本研究中所使用的乙醇-汽油参比燃料混合物实验样本集均来源于文献[21],总计有44个研究法辛烷值(RON)样本。其中80%的样本划分为训练集(序号1-35),用于建立预测模型;20%的样本划分为测试集(序号36-44),用于模型的外部验证。详细样本数据见表1[21]。

1.2 混合描述符的计算

在本研究中应用分子结构的简单表征(Simplex representation of molecular structure, SiRMS)描述符对乙醇-汽油参比燃料混合物的分子结构特征进行表征。SiRMS描述符是一种分子结构参数描述符[22-23],它通过对分子进行四原子碎片化实现混合体系分子结构特征的表征。SiRMS描述符不仅可以表征分子的原子类型、键型,还能表征原子之间的拓扑结构等信息。SiRMS描述符总计有11种拓扑结构类型,具体见表2。SiRMS描述符的计算公式如式(1):

D=x1D1+x2D2+x3D3

(1)

式中,x1、x2、x3为各组分的摩尔系数;D1、D2、D3为各组分中某个四原子碎片的数量。

根据表2的结构划分方式可知,本研究中使用样本中涉及的SiRMS描述符共计25个。

表1 乙醇-汽油参比燃料混合物各组分比例及其RON值[21]Table 1 Compositions and the RON values of ethanol-primary reference fuel mixtures[21]

表2 四原子碎片拓扑结构类型Table 2 Topological structure types of tetratomic fragments

1.3 描述符的筛选及建模

在本研究中应用遗传-多元线性回归(GA-MLR)组合算法对上述SiRMS描述符进行优化筛选与建模,建立最优的乙醇-汽油参比燃料混合物辛烷值线性预测模型。GA-MLR算法结合了遗传算法GA的全局优化搜索能力[24]和多元线性回归MLR简便直观的建模能力,具有较好的变量选择和模型优化效果。GA-MLR算法通过MATLAB软件编写,相关参数设置为:群体中个体的数目为100,交叉概率Pc为0.5,变异概率Pm为0.0001,最大遗传代数为500。

1.4 模型验证及应用域分析

随后采用威廉姆斯图[26]对模型的应用域进行分析。威廉姆斯图的横轴为杠杆值,反映了某一样本与训练集中样本在结构上的相似性,用hi表示。如果杠杆值hi大于警告杠杆值h*,则表明该样本与训练集样本在结构上存在较大差异。警告杠杆值h*的计算公式如式(2):

(2)

其中,p′表示用于建模的描述符个数;n′表示训练集中样本的总数量。

1.5 模型的机理解释

为了明确筛选出的特征结构参数对辛烷值的影响程度大小,掌握其对辛烷值的影响规律,本研究中采用平均影响值法对所建模型中各描述符的相对重要程度进行评价,其计算公式如式(3)[27]:

(3)

式中,ME为平均影响值;J为模型中描述符的个数;aj表示第j个描述符的回归系数;Dij为第j个描述符对于每个样本的数值;m为描述符的个数。ME的符号为正值,表明该描述符与目标属性呈正相关;ME符号为负值,表明该描述符与目标属性呈负相关。ME的数值越大,表示该描述符对模型的影响越大;反之,描述符对模型的影响越小。

2 结果与讨论

2.1 模型结果

针对训练集样本,应用GA-MLR算法对计算出的SiRMS描述符进行优化筛选和建模,确定与乙醇-汽油参比燃料混合物研究法辛烷值最为密切相关的2个分子碎片描述符,其名称及含义见表3;最优描述符子集所对应的最佳MLR预测模型如式(4)所示:

(4)

式中,X11、X13为筛选出的分子碎片描述符;R2为模型复相关系数;RMSE为均方根误差;n为训练集样本数;p为模型显著性概率。

表3 RON模型筛选出的特征描述符及其含义Table 3 Meanings of the selected descriptors for prediction model of RON

随后,应用所建模型对35个训练集样本进行校验,以评价模型的拟合能力;同时,应用所建模型对未参与建模的测试集样本进行预测,以验证模型的外部预测能力。模型对所有样本的预测值见表1,预测值与目标值的比较见图1。

图1 RON模型预测值与目标值的比较Fig.1 Comparisons between the predicted and observed RON values for the prediction model

2.2 模型的验证

RON模型的主要性能参数见表4。从表4可以看出,对训练集和测试集样本的预测RMSE分别为1.840和1.925,误差较小且较为接近,表明模型同时具有较优的预测能力及较强的泛化性能。

在此基础上,对预测模型的残差进行分析,结果见图2。由图2可见,样本集样本较为均匀地分布在0轴两侧,不存在明显的规律性,表明模型建立过程中未产生系统误差。

表4 RON模型的主要性能参数Table 4 Main performance parameters of prediction model of RON

AAE—Average absolute error; APE—Average percentage error; SE—Standard error

为了进一步对所建模型的稳定性进行分析,本研究应用“Y-随机性检验”方法[28]对预测模型重复运行50次,得到相对最优模型的R2为0.032,不足原始模型R2的1/10。由此可见,只有在辛烷值与特征描述符一一对应时才能获得准确可靠的预测模型,说明在本研究中所建立的预测模型不存在“偶然相关”现象,具备较强的稳定性。

图2 RON预测模型残差图Fig.2 Plot of the residuals versus the observed RON values for the prediction model

2.3 模型的应用域分析

为了确保模型对外部样本预测结果的准确性和可靠性,需要对模型应用域进行分析,避免其产生不合理的预测结果,确保模型的外推能力。

本研究中采用威廉姆斯图方法对模型的应用域进行分析,分析结果见图3。其中,横坐标为样本杠杆值,纵坐标为样本的标准化残差。选取模型的3倍标准化残差作为样本预测残差判断界限。由图3可知,模型的警告杠杆值h*为0.17,模型大部分样本都位于警告杠杆值和残差判断界限所构成的矩形区域内,该区域即为预测模型的应用域,当预测模型对位于该区域内的样本进行预测时,可以认为预测结果是有效、可靠的。

2.4 模型的机理解释

为了进一步明确模型中各描述符对乙醇-汽油参比燃料混合物辛烷值的影响程度大小及规律,应用描述符重要度分析方法,对模型中各描述符的重要度进行比较和分析。

图3 RON预测模型的威廉姆斯图Fig.3 Williams plot for prediction model of RON

3 结 论

(1)对乙醇-汽油参比燃料混合物的研究法辛烷值开展了混合物的定量结构-性质相关性(M-QSPR)研究,应用SiRMS描述符对混合体系的分子结构特征进行表征,应用遗传算法从大量描述符中优化筛选出与乙醇-汽油参比燃料混合物辛烷值最为密切相关的结构参数,建立了相应的辛烷值理论预测模型。模型验证及稳定性分析结果表明,模型具有较优的预测能力和泛化性能,且稳定性较高。

(3)本研究为工程上提供了一种根据分子结构参数快速预测乙醇-汽油参比燃料混合物辛烷值的新方法。

[1] MARINOV N. A detailed chemical kinetic model for high temperature ethanol oxidation[J].International Journal of Chemical Kinetics, 1999, 31(2): 183-220.

[2] HEYWOOD J B. Internal Combustion Engine Fundamentals[M].New York: McGraw-Hill, 1988:723.

[3] FIENGO G, GAETA A D, PALLADINO A, et al. Introduction to Internal Combustion Engines[M].London: Springer London, 2013: 408-415.

[4] KALGHATGI G T. Fuel/Engine Interactions[M].Warrendale: SAE International, 2014: 201-231.

[5] ASTM D2699-08, Standard Test Method for Research Octane Number of Spark-Ignition Engine Fuel[S].

[6] ASTM D2700-14, Standard Test Method for Motor Octane Number of Spark-Ignition Engine Fuel[S].

[7] 仇爱波, 周如金, 邱松山, 等. 汽油组分及汽油辛烷值预测方法研究进展[J].天然气化工(C1化学与化工), 2014, 39(2): 62-66. (QIU Aibo, ZHOU Rujin, QIU Songshan, et al. Review of octane number prediction methods for gasoline components and gasoline[J].Natural Gas Chemical Industry(C1 Chemistry and Chemical Industry), 2014,39(2): 62-66.)

[8] GHOSH P, HICKEY K J, JAFFE S B. Development of a detailed gasoline composition-based octane model[J].Industrial & Engineering Chemistry Research, 2006, 45(1): 337-345.

[9] LUGO H J, RAGONE G, ZAMBRANO J. Correlations between octane numbers and catalytic cracking naphtha composition[J].Industrial & Engineering Chemistry Research, 1999, 38(5): 2171-2176.

[10] ALBAHRI T A, RIAZI M R, ALQATTAN A A. Analysis of quality of the petroleum fuels[J].Energy & Fuels, 2003, 17(3): 689-693.

[11] KARDAMAKIS A A, PASADAKIS N. Autoregressive modeling of near-IR spectra and MLR to predict RON values of gasolines[J].Fuel, 2010, 89(1): 158-161.

[12] 王宗明, 华伟英, 程桂珍, 等. 近红外光谱法测定汽油辛烷值和辛烷值仪的研制[J].石油炼制与化工, 1997, 28(1): 22-27. (WANG Zongming, HUA Weiying, CHENG Guizhen, et al. Determination of octane numbers of gasoline by FT-near infrared (FT-NIR) spectroscopy and the development of a FT-NIR octane number analyzer[J].Petroleum Processing and Petrochemicals, 1997,28(1): 22-27.)

[13] 史月华, 陆勇, 徐光明, 等. 主成分回归残差神经网络校正算法用于近红外光谱快速测定汽油辛烷值[J].分析化学, 2001, 29(1): 87-91. (SHI Yuehua, LU Yong, XU Guangming, et al. Principal component regression residual artificial neural network calibration algorithm applied in neat infrared fast measurement of gasoline octane number[J].Chinese Journal of Analytical Chemistry, 2001, 29 (1): 87-91.)

[14] 朱晓, 蒋军成, 潘勇, 等. 基于支持向量机方法的烷烃辛烷值预测[J].天然气化工(C1化学与化工), 2011, 36(3): 54-57. (ZHU Xiao, JIANG Juncheng, PAN Yong, et al. Prediction of octane numbers of alkanes based on support vector machine[J].Natural Gas Chemical Industry (C1 Chemistry and Chemical Industry), 2011, 36(3): 54-57.)

[15] MEUSINGER R, MOROS R. Determination of quantitative structure-octane rating relationships of hydrocarbons by genetic algorithms[J].Chemometrics & Intelligent Laboratory Systems, 1999, 46(1): 67-78.

[16] LIU Zhefu, ZHANG Linzhou, ELKAMEL A, et al. Multiobjective feature selection approach to quantitative structure property relationship (QSPR) models for predicting the octane number of compounds found in gasoline[J].Energy & Fuels, 2017, 31(6): 5828-5839.

[17] 王宁, 徐亦方. 一种用拓扑指数和基团组成预测烷烃辛烷值的方法[J].石油学报(石油加工), 1998, 14(3): 67-73. (WANG Ning, XU Yifang. A new prediction method for antiknock of alkanes with topological indices and group composition[J].Acta Petrolei Sinica (Petroleum Processing Section), 1998, 14(3): 67-73.)

[18] HSIEH W D, CHEN R H, WU T L, et al. Engine performance and pollutant emission of an SI engine using ethanol-gasoline blended fuels[J].Atmospheric Environment, 2002, 36(3): 403-410.

[19] KAPUS P E, FUERHAPTER A, FUCHS H, et al. Ethanol direct injection on turbocharged SI engines-potential and challenges[C]//Detroit: SAE World Congress & Exhibition, 2007: 989-991.

[20] KAR K, CHENG W K, ISHII K. Effects of ethanol content on gasohol PFI engine wideopen- throttle operation[J].SAE International Journal of Fuels & Lubricants, 2009, 2(1): 895-901.

[21] ALRAMADAN A S, SARATHY S M, KHURSHID M, et al. A blending rule for octane numbers of PRFs and TPRFs with ethanol[J].Fuel, 2016, 180: 175-186.

[22] KUZ’MIN V E, ARTEMENKO A G, MURATOV E N. Hierarchical QSAR technology based on the simplex representation of molecular structure[J].Journal of Computer-Aided Molecular Design, 2008, 22(6-7): 403-421.

[23] MURATOV E N, VARLAMOVA E V, ARTEMENKO A G, et al. Existing and developing approaches for QSAR analysis of mixtures[J].Molecular Informatics, 2012, 31(3-4): 202-221.

[24] MERCADER A G, DUCHOWICZ P R, FERNNDEZ F M, et al. Replacement method and enhanced replacement method versus the genetic algorithm approach for the selection of molecular descriptors in QSPR/QSAR theories[J].Journal of Chemical Information & Modeling, 2010, 50(9): 1542-1548.

[25] TROPSHA A, GRAMATICA P, GOMBAR V. The Importance of being earnest: Validation is the absolute essential for successful application and interpretation of QSPR models[J].QSAR & Combinatorial Science, 2003, 22(1): 69-77.

[26] SAHIGARA F, MANSOURI K, BALLABIO D, et al. Comparison of different approaches to define the applicability domain of QSAR models[J].Molecules, 2012, 17(5): 4791-4810.

[27] 蒋军成, 潘勇. 有机化合物的分子结构与危险特性[M].北京: 科学出版社, 2011: 224-226.

[28] RÜCKER C, RÜCKER G, MERINGER M. Y-randomization and its variants in QSPR/QSAR[J].Journal of Chemical Information & Modeling, 2007, 47(47): 2345-2357.

猜你喜欢
描述符辛烷值混合物
多组分纤维混合物定量分析通用计算模型研制
正丁醇和松节油混合物对组织脱水不良的补救应用
基于结构信息的异源遥感图像局部特征描述符研究
基于AKAZE的BOLD掩码描述符的匹配算法的研究
质量比改变压缩比的辛烷值测定机
催化裂化汽油辛烷值助剂应用成功
PNNL开发车载分离技术将乙醇从汽油中分离出来使辛烷值随需变化
Linux单线程并发服务器探索
利用CNN的无人机遥感影像特征描述符学习
研究法辛烷值和马达法辛烷值对直喷汽油机性能的影响