基于SHPSO-GA-BP的成品汽油调和中加氢汽油组分辛烷值的预测

2020-07-21 07:15李炜王晓明蒋栋年李亚洁梁成龙
化工学报 2020年7期
关键词:辛烷值适应度汽油

李炜,王晓明,蒋栋年,李亚洁,梁成龙

(1 兰州理工大学电气工程与信息工程学院,甘肃兰州730050; 2 甘肃省工业过程先进控制重点实验室,甘肃兰州730050; 3 兰州理工大学电气与控制工程国家级实验教学示范中心,甘肃兰州730050;4 中国石化兰州石化分公司油品储运厂,甘肃兰州730060)

引 言

在成品汽油的生产过程中,油品的质量是影响生产效益的关键因素,如何在保证质量的同时实现利益最大化是企业的根本目标。合格的成品汽油是根据各添加组分的实际品质和不同成品油的标号指标,由不同比例的多种组分组成的混合物,严格控制其添加量是保证油品质量的关键。因此,在汽油调和系统中,建立行之有效的配方模型是确保产品质量与企业效益的关键。但是,在实际的工业中,组分油的添加很多依旧是根据成品油标号与原料的组分,基于线性关系进行的搭配,而它们之间并非只有线性关系,这种粗略的线性调和方式,要么造成产品质量过剩,增加企业的生产成本,要么难以保证一次成功率,据2018年某大型炼化企业统计的一次成功率仅为84.5%,造成了资源的严重浪费。因此,亟需一种有效的调和配方来改变这种调和模式。近年来,数据驱动技术的发展为解决这一难题提供了新的解决思路,但是由于现有测量技术以及复杂工况的制约,油品的关键质量指标辛烷值往往难以实时获取,而这又是建立调和配方模型的基础,因此,建立准确的辛烷值预测模型就显得尤为重要。

近年来许多学者也对此领域开展了相关研究。传统的对辛烷值的研究主要有两个方面,一是从分子层面对汽油组分辛烷值的定量结构-性质相关性的研究[1-3],常用方法如拓扑指数法[4]、基团贡献法[5]。二是以仪器分析为基础,对各汽油组分、组分吸光度、各组分含量进行分析,利用这些参数对汽油的混合辛烷值进行线性建模分析。如利用主成分分析法和多元线性回归结合[6]、岭回归与多元线性回归结合[7]、线性预测编码和多元线性回归结合[8]、主成分回归和偏最小二乘回归结合[9]以及偏最小二乘[10-11]及其变种[12]、拉曼技术[13]等进行建模测定。考虑到变量间的非线性因素,而人工神经网络对复杂非线性系统较强的处理能力,工程上也将其用于辛烷值的预测,并取得良好的效果[14-18]。

随着人工神经网络的广泛应用,考虑基于梯度下降的BP算法对初始权值的选择依赖较大,且存在收敛速度慢、容易陷入局部最优等缺点,而进化算法由于具有良好的优化性能,开始广泛用于各类优化问题之中[19-20],如将GA 和PSO 用于神经网络参数的优化[21-23],虽然它们解决了神经网络中的梯度下降问题,但遗传算法的选择、交叉、变异等操作使得神经网络的训练时间随着问题的规模及复杂程度指数增长,而其缺乏有效的局部搜索机制,又使得算法在接近最优解时收敛缓慢甚至停滞;PSO 算法仍存在精度低、易发散、种群易早熟导致无法达到最优解等。为了获得更好的优化效果,许多学者将二者结合起来用于优化问题的求解,但在辛烷值预测中却少有涉及。虽然结合方法因问题而异,但不外乎串行[24]和并行[25]两种方式[26],它们或以遗传算法为主导[27]或以粒子群算法为主导[28]。这些方法尽管对优化性能有了不同程度的改进,但大多仍是以某一算法为主,间接引入其他算法的部分操作,缺乏更为有效的深度融合。

综上所述,受成品调和配方建模中加氢汽油组分辛烷值的准确预测的需求驱动,本文提出了一种SHPSO-GA用于优化BP网络(SHPSO-GA-BP)的新方法,并将其用于加氢汽油组分辛烷值的预测。该方法首先将粒子群算法的输出根据适应度值,分为优劣2 个种群,优的保留,劣的淘汰;然后在粒子群算法中引入遗传算法的交叉、变异操作,并从产生的新种群中选择最优的群体用于迭代优化,最后将最优的种群用于优化BP网络参数。

1 成品汽油调和配方建模思路

成品汽油调和是指在非标油中加入多种组分和添加剂,调和成符合客户要求的国标汽油的技术。调和过程主要以调和配方模型为基础,根据操作人员输入的组分油的各项参数,按照已有的模型进行计算,得出一组符合产品指标的调和比例,并换算为组分油流量值,下达给现场操作人员作为初始设定值进行调和。因此,配方作为各组分油添加量的一种预测度量,其模型的准确性对油品质量的提升具有重要意义。

鉴于实际生产工艺需求,建立成品汽油配方模型主要是为了确定醚化汽油、MTBE、车用异辛烷、汽油重芳烃、生成油、乙苯、甲苯、二甲苯以及加氢汽油等9 种组分油的添加比例,其中加氢汽油是主料,其他组分的添加取决于主料的各参数品质。主料受不同原油的影响,其品质参数会有波动,且调和过程非定量的物理混合,考虑其过程的复杂性,通过对现场信息系统可提供的数据及生产调度运行表的分析,成品汽油配方建模需进行两阶段的建模,一是以芳烃含量、烯烃含量、烷烃含量、密度、研究法辛烷值和抗爆系数6 种指标作为输入,建立加氢汽油调和比例模型;二是以研究法辛烷值、抗爆性、10%蒸发温度、50%蒸发温度、90%蒸发温度、终馏点、蒸气压、硫含量、苯含量、芳烃含量、烯烃含量、氧含量、密度、加氢汽油含量14 项指标为输入,建立醚化汽油、MTBE、车用异辛烷、汽油重芳烃、生成油、乙苯、甲苯、二甲苯8 种组分的调和比例模型。

综上分析不难看出,在成品汽油调和配方建模过程中,辛烷值贯穿2个阶段,但是受现有在线分析技术的制约,建模中的这一关键指标研究法辛烷值在已有数据集合中仅是加氢汽油其他品质参数的1/10,但它却与10%蒸发温度、50%蒸发温度、90%蒸发温度、终馏点、蒸气压、硫含量、苯含量、芳烃含量、烯烃含量、密度这10 项指标密切相关,因此,为了更好地利用已有历史数据,并为后续配方建模奠定基础,首先须建立加氢汽油组分的辛烷值预测模型,使其在配方建模中具有数据的完整性。

2 SHPSO-GA-BP预测模型的建立

2.1 存在问题分析

从已有基于BP网络对辛烷值预测的文献来看,大多采用单一算法,涉及混合PSO-GA 优化算法的少有,而着眼其他领域对BP 网络的优化,大多考虑是将GA 的全局性与PSO 的记忆、信息共享能力相结合用于优化问题的求解,无论是并行还是串行,算法之间只是简单结合,缺乏有效的深度融合。就并行结合而言[28-29],主要采用独立优化的方式,即首先随机初始化一个种群,然后分别采用两种算法同时计算适应度,最后从混合后的种群中取出最好粒子或个体,这种方法一是未真正融合两者优点,二是增加了算法的复杂度,使得运算时间加长。就串行而言[30-31],一般采用顺序结合方式,即将一个种群的进化周期一分为二,进化前期采用一种算法,后期再采用另一种算法。这种结合势必会出现:进化前期已达到最优解,则进化后期另一算法的引入就显得无意义,或是进化前期未达到最优解,则后期另一算法的引入,在提高算法精度的同时引起收敛速度慢等问题。因此,从以往的混合算法来看[32-33],仍存在两个弊端,一是对初始种群未进行有效处理,二是混合算法之间缺乏更优的深度融合。

2.2 SHPSO-GA-BP方法构思

针对前述PSO-GA 结合存在的缺点,考虑从初始种群产生和算法融合方式两方面入手进行改进,以更好地将PSO 的快速性、记忆性与GA 的全局性相融合,达到优势互补进而提高混合算法精度及收敛速度的目的。据此,本文以串行PSO-GA 方法为基础,对其进行改进,一是采用PSO 对初始种群进行处理,从中选择优质的种群,弃劣存优;二是将PSO 和GA 有机交替融合,即对种群中的每一代个体,都进行PSO 以及GA 的交叉、变异操作,称之为SHPSO-GA。该算法的思想和交替过程可以概括为:①首先,采用PSO 产生初始种群,计算适应度值并按升序排序,再依据适应度值大小将种群分为优劣两个种群,遗弃劣质种群,并在留优种群中找到群体最优适应度值,进而找到个体、群体最优,由此对粒子位置和速度进行更新;②其次,对留优种群引入GA 的交叉操作,以使子代继承父代优良品质,同时扩大种群多样性,其后再引入GA 的变异操作,对交叉后的种群再次进行优化,以进一步提升种群多样性,由此可以产生同劣质种群大小规模相同的子代,将此子代与父代结合,组成新的种群;③再者,计算新种群的适应度值并排序,再次对种群进行留优处理,找到群体、个体最优,并进行粒子位置和速度最优再更新,至此第一代优化结束;④接着,以事先设定的最大迭代次数为依据,对留优种群进一步进行PSO+GA 循环优化,直至找到全局最优;⑤最后,将最优个体作为BP的权值和阈值。至此优化过程结束。可以看出,SHPSO-GA 算法与现存PSOGA算法的本质差异在于,SHPSO-GA对种群中的每一代个体都进行了PSO+GA 的交替融合式优化,而不像PSO-GA 将PSO 或GA 孤立地局限于优化过程的某一阶段。因此,这种通过两种算法之间的不断交替来实现二者之间的深度融合,势必会使PSO 的快速性、记忆性与GA 的全局性等优势得到更有效的互补,从而为最优个体的获取提供可能。

2.3 SHPSO-GA-BP建模流程与步骤

SHPSO-GA-BP的建模流程如图1所示。

具体算法实现步骤如下:

图1 SHPSO-GA-BP算法基本流程Fig.1 Basic flow of SHPSO-GA-BP algorithm

(1)参数设置。给定BP 神经网络的输入层、隐含层、输出层节点个数,学习率、迭代次数,连接权值和阈值的取值范围,遗传算法和粒子群算法的相关参数,如变异概率、交叉概率、惯性因子、约束因子、加速度因子,以及迭代次数、期望的适应度值等。

(2)参数初始化。在优化之前,需要将待优化的神经网络的参数编码为粒子群的个体信息,这里主要用算法优化权值和阈值,若输入层、隐含层、输出层节点个数分别为n,q,m,则待优化参数个数为D,其中D可以表示为:

因此可以将所有参数表示为D维向量,作为粒子群个体的编码信息;其次,根据权值和阈值的取值范围随机初始化粒子的位置和速度编码,并设置粒子群的个数D。

(3)BP 网络构建。通过输入、输出数据的维度确定隐含层节点的个数以及网络的传递函数。

(4)计算粒子的适应度值。通过BP网络的前向训练,计算出实际值与期望值之间的均方误差,并将均方误差设置为粒子的适应度值。

(5)寻找最优种群。将适应度值从小到大排列,并将其平分为种群P1 和种群P2,留下优质的P1,舍弃劣质的P2。

(6)在留优种群P1 中寻找个体最优(Pbest)和群体最优(Gbest)。

(7)更新粒子的速度和位置。

(8)交叉。对种群P1 进行交叉操作,以此为子代继承父代的优良品质提供可能。交叉操作采用实数交叉方法,对粒子的位置和速度按照交叉概率Pc进行两两配对。

(9)变异。对种群进行变异操作,以此扩大搜索空间,使粒子能够跳出先前搜索到的最优位置,为保持种群的多样性和找到全局最优值提供了可能。

(10)经过以上的交叉、变异操作,可以得到新的种群,此时将新种群作为优化的权值和阈值,代入网络中进行训练,计算出进化种群的适应度值,并将此种群和父代P1组成新的种群P2。

(11)对新种群P2 根据适应度值再次进行留优处理,挑选优质的一半作为种群P3。

(12)个体最优更新和群体最优更新。

(13)判断是否达到设定的最大迭代次数。如果满足条件,则优化停止,转入步骤(14),如果不满足条件,则转入步骤(7)。

(14)将满足条件的最终优质粒子作为优化之后的权值和阈值。

(15)训练BP 网络并用于预测。经过以上的优化,将最优的权值和阈值代入网络中进行训练,由此得到最终优化之后的输出结果。

至此,优化过程结束。

3 加氢汽油组分辛烷值预测仿真与结果分析

3.1 参数设置

在进行仿真之前,设置合理的参数是至关重要的,这将直接影响到网络的预测性能。为了比较改进算法与其他算法的性能,参数设置应该保持一致。需要设置的参数主要包括BP 神经网络的结构和相关参数,遗传算法、粒子群算法和PSO-GA 算法的参数。

通过对某大型炼油厂2017—2019 年真实测量数据的处理,从中挑选出1107 组数据,取其中的1000 组用于网络的训练,余下的107 组用于网络的测试。神经网络的输入层神经元个数为10,取决于辛烷值的影响因子:10%蒸发温度、50%蒸发温度、90%蒸发温度、终馏点、蒸气压、硫含量、苯含量、芳烃含量、烯烃含量、密度等。通过经验公式2n+1 和多次的测试,选定隐藏层数为21,因此将网络的最终拓扑结构设为10-21-1。其他参数设置如下:隐含层的传递函数为tansig,输出层传递函数为purelin,神经网络的学习率为0.01,训练目标最小收敛误差为0.001,最大训练次数1000次。

对于遗传算法参数的选择没有定性规定,通常设置种群规模大小为20~200,交叉概率为0.1~1.0,变异概率为0~0.05;对于种群进化次数的确定,通常需综合考虑背景问题的复杂程度以及实际数据的多次预仿真结果,因此,这里最终选择种群最大迭代次数为50,交叉概率为0.8,变异概率为0.05。

粒子群算法中,惯性权重(w)的选取是影响算法性能的关键因素,不同惯性权重的选择可能会导致算法的收敛速度不同甚至不收敛,很多研究者都对惯性权重进行过研究[34-35],这里采用文献[36]所提出的惯性权重随着迭代次数线性递减的模型,通过调整权重来实现搜索能力的提升,较大的w的值可以跳出局部极小值,利于全局搜索,较小的w的值有利于算法收敛,可加强局部搜索能力,如下

式中,w为惯性权重,k为当前迭代次数,kmax为迭代总数,wmax、wmin分别表示最大、最小惯性权重,通常取wmax=0.9,wmin=0.4。种群规模设为50,根据式(1)和网络的拓扑结构,计算出D=253,因此将粒子维度设为253;同时,考虑后续SHPSO-GA 算法运行中,能有效实现每一代PSO 和GA 的交替优化,并结合预仿真验证结果,最终将进化次数设为50,惯性因子为0.7,加速度因子均为1.4[36],将粒子的最大速度、最小速度,以及最大位置、最小位置均限制在[-1,1]内。

对于SHPSO-GA-BP 与PSO-GA-BP 算法,为了更为公平地比较各方法的优劣,保持参数一致尤为重要,因此,仿真中涉及到的相关参数均与PSO 与GA一致,迭代次数也设定为50。

本文所用算法均通过MATLAB2019a 实现。所使用的计算机配置为AMD A8-7100 Radeon R5,8 Compute Cores 4C+4G 1.80 GHz。

3.2 模型性能评价指标

为了对加氢汽油组分辛烷值预测模型的性能进行评价,采用常用的性能评价指标均方误差(mean-square error,MSE)和绝对误差和(sum of absolute differences,SAD),并定义预测误差分布(prediction error distribution,PED)评价指标。

(1)常用性能指标

(2)预测误差分布 由于本文属于回归问题,模型的预测值很难完全等于实际值。为了从预测值个体误差的角度出发,更为详细地比较各种方法的性能,本文特定义PED 指标,对验证数据集的误差做出频数分布直方图,并考虑工程中允许的误差,当误差聚集在误差范围之内的数越多,即预测值与真实值接近的数据也就越多,则说明预测效果越好。将分布在误差带内的预测数据个数与预测数据总个数的百分比作为评价标准PED,也即准确率。

定义:设δ为给定误差范围,Δ表示小于等于δ的预测误差,则分布在误差范围δ内的预测数据个数占预测数据总个数的百分比,即为预测准确性PED,可表示为:

其中,num(Δ≤δ)表示分布在误差在δ范围之内的预测数据个数,num(N)表示预测数据的总个数。显然,预测数据位于误差范围之内的比重越大,说明预测准确率越高。

3.3 实验结果对比与分析

3.3.1 适应度分析 为显现文中方法的优越性,本文 分 别 对GA-BP、PSO-BP、PSO-GA-BP 以 及SHPSO-GA-BP 几种方法进行对比研究,采用均方误差作为适应度值,其适应度值随进化次数的变化曲线如图2所示。

图2 四种网络适应度曲线(终止代数=50)Fig.2 Four network fitness curves

从图2 可以看出,经过50 次的种群进化,采用GA、PSO 以及PSO-GA 优化BP 权值和阈值之后,其适应度值均不同程度地减小,GA-BP在28代附近达到稳定值0.026,PSO-BP 在7 代附近达到稳定值0.0275,PSO-GA-BP 在31 代 附 近 达 到 稳 定 值0.0261,SHPSO-GA-BP 在11 代 附 近 达 到 稳 定 值0.0256。对比可知GA-BP 预测模型适应度值较小,但收敛速度慢,PSO-BP 算法收敛速度最快,但精度不足。文中对PSO 与GA 算法的深度融合,使得混合算法SHPSO-GA-BP 既有快速收敛性又有较小的均方误差,很好地继承了两者的优点。但在传统PSO-GA-BP 模型中,PSO、GA 两种算法各占迭代次数的一半,在25 代之前PSO 起作用,可以看出其收敛速度很快,在第7代已经收敛,但却陷入了局部极小值,25 代之后GA 起作用,跳出了局部极小值,也得到最小均方误差。

对比SHPSO-GA-BP 和PSO-GA-BP,出现上述现象的原因主要在于两种算法融合方式的不同,前者通过算法之间的交替作用来实现二者之间更优的深度融合,优选粒子的同时进行遗传算法的交叉变异操作,从而使得最优个体还有进一步提升的可能,更容易找到全局最优和加快收敛速度;而后者PSO 和GA 之间只是简单结合,本质上还是独立作用,迭代前期PSO 起作用,快速但容易陷入局部极小值,迭代后期GA 起作用,这种结合势必会牺牲快速性来提高精度。

综上可知,文中提出的SHPSO-GA-BP 预测方法具有更快的收敛速度和更小的适应度值。

3.3.2 预测准确性分析 图3给出几种方法对辛烷值的预测结果。

为了更直观地呈现所提出方法的优越性,图4给出预测误差分布图和密度图,表1 给出几种方法的性能比较。

表1 几种方法性能比较Table 1 Performance comparison of several methods

从图4 可以看出,BP 网络的误差在0.08 之前分布较为均匀,0.1 左右频数较大,说明网络的训练结果与实际值存在一定偏差;GA-BP 网络的误差大部分控制在0.08 之内,其后误差分布平缓,说明训练结果的大部分值能很好地接近实际值,但也存在部分异常值;PSO-BP 网络的误差部分聚集在0.04 之内,其余大部分分布在0.04~0.16,0.2 之后也有部分分布,说明训练结果除了部分能很好地接近实际值之外,大部分存在一定偏差;PSO-GA-BP 网络的误差一大部分聚集在0.08 之内,其余的大部分聚集在0.2 之前,其后有少量分布,说明网络的训练结果能很好地接近实际值,网络偏差较小;SHPSO-GA-BP网络的误差有接近40个聚集在0.04之内,其余的大部分也能聚集在0.2 之前,说明其误差更小。因此,从最小预测误差来看,SHPSO-GA-BP 预测性能最好,PSO-GA-BP次之。

图3 几种方法预测结果Fig.3 Prediction results of several methods

从表1可以看出,采用本文PSO 与GA 交替融合的算法优化BP 网络之后,其预测值的均方误差、绝对误差和以及相应误差内的准确率等性能,较其他方法均有很大提升;在网络的训练时间上,与其他三种混合优化算法相比,其值也有显著下降。通过比较误差在0.05、0.15范围之内的准确率,还可以看出文中提出的方法均具有最好的准确率。综上结果表明文中的SHPSO-GA-BP 模型用于预测辛烷值具有更优的性能。

4 结 论

受成品汽油调和配方建模中质量指标辛烷值的预测需求驱动,本文提出了一种将GA 的全局搜索能力与PSO 的记忆性、快速性有机融合,用于优化BP 网络参数的SHPSO-GA-BP 预测建模方法,并将其应用于加氢汽油组分辛烷值的预测中,其结果表明:

图4 几种方法预测误差分布图和密度图Fig.4 Error distribution and density map of several methods of prediction

(1)文中提出的SHPSO-GA-BP 方法,通过引入PSO对种群进行弃劣留优处理、引入GA对优选粒子进行交叉变异操作,以算法的交替作用方式实现了二者之间更优的深度融合,相比PSO-GA-BP 方法分别采用PSO 和GA 独立作用于迭代前期和后期,SHPSO-GA-BP 能更容易且更迅速地找到全局最优。

(2)基于本文提出的SHPSO-GA-BP 方法,对于加氢汽油组分辛烷值的预测建模,无论是模型的训练速度还是预测精度,相较其他GA-BP、PSO-BP、PSO-GA-BP 等改进方法,均显现出更优的性能,因而更适于加氢汽油的辛烷值预测建模,这也为后续成品汽油调和配方需求的完备数据生成提供了可能。

猜你喜欢
辛烷值适应度汽油
改进的自适应复制、交叉和突变遗传算法
质量比改变压缩比的辛烷值测定机
PNNL开发车载分离技术将乙醇从汽油中分离出来使辛烷值随需变化
车用汽油辛烷值测定准确度相关影响因素探究
启发式搜索算法进行乐曲编辑的基本原理分析
研究法辛烷值和马达法辛烷值对直喷汽油机性能的影响
基于人群搜索算法的上市公司的Z—Score模型财务预警研究
大数据是“原油”,不是“汽油”
汽油直接喷射系统