基于RS⁃PSO⁃SVM的航材消耗预测模型

2021-12-31 02:21孙绳山徐常凯何亚群
南京航空航天大学学报 2021年6期
关键词:约简航材消耗

孙绳山,徐常凯,何亚群

(1.空军勤务学院研究生大队,徐州 221000;2.空军勤务学院航材四站系,徐州 221000)

航材消耗预测,作为航材保障工作中的重要一环,是根据航材历史保障数据,预估和推测航材供应未来的消耗量和变化趋势[1]。近年,台海、南海、中印等国际周边局势不确定性增强,飞机飞行训练、演习演练频次增加,空军航空兵部队保障压力增大,这就对航材消耗预测工作提出了新的、更高的要求。航材库存储备数量过多,占用航材保障经费,造成库存积压;反之,航材库存储备数量过低,易导致飞机缺材停飞,后果不堪设想。准确把握航材消耗数量,能够更好地服务于飞机的飞行训练,提升航材保障的军事效益和经济效益。

当前,航材库存结构的不合理导致大量航材经费积压,严重影响航材保障任务的深入开展,结合航材保障历史数据,合理预测航材消耗数量一直以来备受关注。

有关航材消耗预测问题,许多学者从不同角度进行了深入研究。有的学者从航材消耗数据本身出发展开研究。左山等[2]通过简单的移动平均法预测了航材需求,易于操作,便于实现。贾治宇等[3]运用差分自回归移动平均模型(Autoregressive integrated moving average model,ARIMA)差分处理航材消耗率,预测结果与移动平均法相比较证明了模型的有效性和可行性。刘信斌等[4]进一步研究具有周期性特点的航材消耗数据,对原始消耗数据常规差分处理和季节差分处理转化为平稳序列,借助SPSS软件实现了航材需求预测。毕钊等[5]通过贝叶斯和模糊软集合确定ARIMA和支持向量机(Support vector machine,SVM)的组合预测权重,实例分析表明,组合权重的方法能够降低单一航材消耗预测的误差。郭峰等[6]选取了10项航材6年内的消耗数据,采用1次指数平滑、2次指数平滑、3次指数平滑三种方法预测航材消耗。实例分析表明,3种分析方法综合运用效果优于任何一种单一方法预测。史永胜等[7]构建了3次指数平滑法的航材需求预测模型,借助粒子群算法(Particle swarm optimization,PSO)在空间内寻优,提高预测精度。

有的学者从影响航材消耗的因素出发,通过分析航材消耗的影响因素与其内在的关联,分析预测航材消耗。李文强等[8]提出运用偏最小二乘法解决小样本、多变量的无人机航材需求问题,文中介绍了建模的原理、步骤,实例分析结果表明,该法可以应用于新机航材库存预警,针对新机样本数量少的特点,指导新机航材库存管理工作。张扬等[9]通过粗糙集(Rough set,RS)和层次分析法计算各个影响因素的权重,用以改进灰色模型预测航材消耗,提高了航材预测精度。魏崇辉等[10]率先使用RS属性约简的方法约简影响航材消耗的冗余因素,并与神经网络相结合预测航材消耗。该法的好处在于RS可以约简定性和定量影响因素,辨识其他算法难以读出的信息。杨仕美等[11]运用了SVM的一元预测和多元预测组合方法,通过信息熵来调节二者的权重,使二者预测值加和得到航材备件的需求数量,提高了航材备件数量的预测精度。尚琦坤等[12]从任务驱动的视角出发,利用决策试验与评价实验室方法选取关键因素,采用遗传算法优化灰色神经网络算法,预测航材需求数量。实例分析表明,该法优于BP神经网络和灰色神经网络。陈博等[13]以某单位执行航材保障任务数据为基础,通过MATLAB建模分析,利用灰色神经网络,预测航材消耗,一定程度上促进了航材转场保障工作的开展。

综上所述,学者们主要从航材历史消耗数据本身和航材消耗数据的影响因素两方面入手,从航材历史消耗数据本身入手预测航材消耗,使用了时间序列法、指数平滑法等方法。这些方法适用于航材消耗规律容易把握,消耗平稳的航材消耗预测。通常,基于航材历史消耗数据本身预测航材消耗,要求掌握一定量的航材消耗数据,这样预测出来的航材消耗结果准确度高,更有说服力;但面对小样本数据的航材消耗预测,准确度难以掌控。从航材消耗影响因素入手预测航材消耗,使用了BP(Back propagation)神经网络、最小二乘法、灰色预测等方法。类似的方法在预测样本较小的数据上具有优势,但是均要求航材原始数据是完备的;在处理不完备信息系统下的航材消耗预测效果偏弱。

本文在前人研究的基础上,创新性地提出一种新的航材消耗预测的组合算法,RS融合PSOSVM。既能满足小样本航材消耗预测的需求,又能够处理不完备信息系统下的航材消耗预测。本文所采用的RS方法在处理定性问题和不完备信息系统问题有着独特的优势,能够客观地分析原始数据。SVM[14]具有较好的学习性能,近年来被广泛应用。部分学者将RS与SVM融合,但是仅仅应用在水质预警[15]、震害预测[16]、泥石流预测[17]等少数领域。结合航材消耗的特点,本文将其应用到航材消耗预测领域。RS与SVM组合方法不仅可以删除影响航材消耗的冗余因素,提高支持向量机的预测性能,还能解决航材消耗预测的非线性问题,对于指导航材库存管理具有借鉴意义和参考价值。

1 基本理论

1.1 粗糙集理论

定义1信息系统

定义2不完备信息系统

如果至少有一个属性a∈A使得Va含有空值,则称S是一个不完备的信息系统,用“*”表示空值[19]。

1.2 粒子群算法

PSO是模拟鸟类觅食的随机搜索算法,简单,易实现,适合处理实优化问题。PSO的基本公式为

2 航材消耗预测模型的构建

2.1 建模步骤

(1)属性约简。利用不完备信息系统属性依赖度函数计算各航材消耗影响因素属性的重要性,约简冗余因素。

定义3属性依赖度函数

当影响航材消耗的属性均为数值型[24]时,设航材消耗不完备决策系统S=(U,C∪D,V,f),B⊆C,航材消耗数量(决策属性)D对影响因素(条件属性)B的依赖度函数σB(D)为

式 中:RE(B)={(xi,xj)|d(xi)=d(xj)和[∃a∈B,s.t.Ta(xi,xj)≥λ或f(xi,a)=*或f(xj,a)=*],i<j};RN(B)={(xi,xj)|d(xi)≠d(xj)和[∃a∈B,s.t.Ta(xi,xj)<λ且f(xi,a)≠*和f(xj,a)≠*],i<j};(0≤λ≤1)Ta(xi,xj)表示xi,xj∈U关于条件属性a的相似度,定义如下

式中:m0=max{f(xk,a)|xk∈U},n0=min{f(xk,a)|xk∈U},E(D)={(xi,xj)|d(xi)=d(xj),i<j};N(D)={(xi,xj)|d(xi)≠d(xj),i<j}。

(3)SVM参数寻优。处理后的完备信息系统数据,在Matlab软件基础上,借助航材消耗历史数据建立PSO-SVM模型,参数(γ,σ2)迭代寻优[25-26]。

(ak,yk)表示航材消耗相关数据,ak∈Rn表示航材消耗的影响因素,y∈R表示航材消耗。SVM支持向量机旨在寻找非线性映射φ(•):Rn→Rnh将航材消耗样本空间映射到高维空间,航材消耗预测问题就转化为以下形式

式中:ω∈Rnh,误差变量ξi∈R,b为偏差量,γ为可调参数。

用拉格朗日法求解该航材消耗预测模型

式中αi(i=1,2,…,l)为拉格朗日乘子。

式中K(x,xi)为满足Mercer条件的对称核函数,常用的有线性核函数、多项式核函数、高斯径向基核函数。本文选择高斯径向基核函数(Radial basis function,RBF),即

RBF的学习能力取决于正则化参数γ和核函数参数σ2的选取。由于粒子群算法计算简便,所以本文采取PSO算法,寻找航材消耗预测模型的全局最优参数组合(γ,σ2)。

(4)模型验证。根据得到最优参数组合(γ,σ2)建立SVM模型,预测航材消耗,并结合真实数据检验模型预测效果。

具体算法流程如图1所示。

图1 粗糙集融合支持向量机模型流程图Fig.1 Flow chart of SVM integrated by RS

2.2 实例分析

本文选取某场站航材股某航材2005—2014年消耗数据,涉及年飞行日、年飞行小时、年起落架次等7个影响因素,即条件属性C={a1,a2,…,a7},由于个别原因,表1缺失部分属性值。航材的消耗按照数量可以划分为低消耗[0,10)、中消耗[10,30)和高消耗[30,+∞)3种类型[27],即决策属性D={3,2,1}。

表1 航材消耗初始数据Table1 Initial data of air material consumption

2.2.1 属性约简

取λ=0.9 ,由式(2~3)可知

由此可以计算出,各航材消耗影响因素的重要度σa1(D)=0.447 ,σa2(D)=0.501 ,σa3(D)=0.487 ,σa4(D)=0.603 ,σa5(D)=0.465 ,σa6(D)=0.613 ,σa7(D)=0.427 。根据各航材消耗影响因素的重要度大小,剔除冗余影响因素,得到各影响因素的相对约简[15]{a2,a4,a6}。所以,该航材消耗量与飞机飞行小时、恶劣天气占比、自然消耗量密切相关。

2.2.2 数据预处理

为了方便下一步预测,对于属性缺失的数据,本文采取平均值方法,即空值补充为同一属性前后两年数值的平均值。同时,剔除冗余的航材消耗影响因素,得到数据如表2所示。

表2 航材消耗数据Table2 Air material consumption data

2.2.3 参数寻优

设PSO算法的种群规模为30,进化200次,以航材消耗数据拟合效果的均方差作为粒子群的适应度函数,进化结果如图2所示,从图2中可以看出,进化到20代左右已寻到了最优参数组合(γ,σ2)=(396.28 ,0.01 )。

图2 适应度曲线Fig.2 Fitness curve

2.2.4 模型验证

结合正则化参数γ和核函数参数σ2的取值,建立RS-PSO-SVM航材消耗预测模型,对航材消耗数据的进行回判检验(图3)。从拟合的效果来看,经过粗糙集不完备决策系统的属性重要性约简,去除冗余信息后,抓住了该航材消耗决策系统的大部分信息,拟合效果的相对误差较小,很好地反映该航材的消耗趋势。

图3 数据回判检验Fig.3 Data callback test

2.3 结果分析

在航材消耗不完备决策系统中,RS-PSO-SVM航材消耗预测模型可以剔除冗余因素,提高了单纯PSO-SVM模型的运算效率,且预测准确度高于PSO-SVM模型。基于粗糙集的属性约简,本文提出的模型预测准确度也优于RS-BP模型,比较结果如图4和表3所示。结果显示,通过RS-BP模型预测该航材消耗量准确度不高,预测效果较差。3种方法中,RS-PSO-SVM航材消耗预测模型效果最佳,不仅降低了模型复杂度,还提高了航材消耗预测的精度,对于指导不完备多因素航材消耗决策系统决策具有一定的参考价值,同时,为应对不确定性条件下航材保障工作打下了基础,推动了减轻现存航材库存积压、改善航材库存结构的工作进程。

图4 航材消耗预测结果Fig.4 Forecast results of air material consumption

3 结 论

处理信息缺失的航材消耗决策系统,粗糙集在约简属性有着内在优势,针对小样本数据量的航材消耗数据,支持向量机又较为适合,不会出现类似于神经网络算法过拟合的现象。PSO算法收敛速度较快,寻优得到的最优参数组合(γ,σ2)=(396.28 ,0.01 ),优化了SVM的预测性能和效果。从实例分析结果来看,RS-PSO-SVM算法预测效果明显优于RS-BP和PSO-SVM。RS-PSO-SVM算法解决了航材消耗不完备决策系统的属性约简,保留了系统的核心知识,解决属性值残缺的航材消耗信息系统问题效果良好,提高了算法的运行效率。面对航材数据缺失的预测和属性约简问题,本文创新性地提出RS-PSO-SVM算法,填补了当前航材消耗不完备决策系统的空白。RS-PSO-SVM算法预测准确率较高,对于指导航材订货工作具有重要实际意义。

本文在缺失值处理上选择了常用的相邻数据取平均值的方法。缺失值的处理方法很多,在日后的研究中,可以深入探讨航材消耗决策系统属性缺失值的处理方法,比较不同缺失值处理方法下的航材消耗预测结果,进一步提高航材消耗预测精度,更好地服务于基层一线航材保障工作,加速空军航空兵部队战斗力的提升。

猜你喜欢
约简航材消耗
转炉炼钢降低钢铁料消耗的生产实践
考虑航材共享的国产民机航材配置技术研究
国产民机“一带一路”沿线区域航材共享研究
降低钢铁料消耗的生产实践
带权决策表的变精度约简算法
面向特定类的三支概率属性约简算法
从“人”的角度浅谈对航材管理的认识
直觉模糊序决策系统的部分一致约简*
近似边界精度信息熵的属性约简
If We Burne d All the Fossil Fuel in the World