基于PCA—BP的飞机爬升段油耗分析模型

2017-07-08 04:05胡小娜
科技创新与应用 2017年19期
关键词:BP神经网络主成分分析

胡小娜

摘 要:鉴于航班油耗影响因素众多、各因素对油耗贡献相差很大、各因素之间耦合关系复杂、非线性关系显著,对爬升段航班油建立模型困难,提出基于PCA-BP方法的油耗分析模型,该方法利用PCA对数据进行降维处理,并用BP神经网络建立油耗模型。结果表明PCA对数据降维作用明显,BP神经网络具有良好的逼近能力和动态特征响应,PCA-BP模型有实际参考价值。

关键词:航班油耗;主成分分析;BP神经网络;油耗模型

中图分类号:V312 文献标志码:A 文章编号:2095-2945(2017)19-0088-02

近年来,我国民航运输业发展快速。随着民航运输业的不断繁荣,航空煤油的消耗量也在逐年上涨。据统计,2014年国内航空煤油的消耗量已达2200多万吨,碳排放量6000多万吨[1]。从保护环境和节约航空运输业成本两方面考虑,节能减排势在必行[2]。

QAR[3](Quick Access Recorder)数据一直以来主要用于飞机的日常维护、飞行检查、飞机性能监视以及飞行品质监控等需要。由于QAR数据包含飞行高度、速度、时间、发动机工作状态、气象状态等参数,而这些参数飞机的油耗密切相关。利用QAR数据建立飞机油耗模型、进行油耗估计、分析油耗影响因素得到越来越多的学者和科研机构的关注。

PCA[4](Principal Component Analysis)方法能够对数据进行降维处理,而BP[5](Back Propagation)神经网络能够对数据进行逼近,建立油耗模型。基于上述原因,提出基于PCA-BP方法的油耗分析模型。

1 油耗研究阶段选取及影响因素确定

1.1 研究阶段选取

正常的飞行过程一般包括起飞滑跑、爬升、巡航、下降和着陆滑跑五个典型飞行阶段。现根据QAR数据将某航段大量航班各典型飞行阶段的油耗占比进行整理,如表1所示。

由表1可以看出,爬升段、巡航段和下降段三个阶段的油耗量占整个飞行油耗量的90%以上。爬升段和下降段油耗量一般不依航程的长短而变化,依航程长短有显著变化的只有巡航段一个阶段。航程越短爬升和下降段油耗量的占比约大。近些年支线航空发展迅速,在直线飞行过程中爬升和下降段油耗占比更大。此外,飞机在本场起降训练或进场调机飞行时多处于爬升、下降或者爬升、低高度巡航、下降两种模式。因此,研究爬升段和下降段油耗的影响因素则更为必要。现在以爬升段为例分析各因素对油耗的影响。

1.2 影响因素确定

依据QAR数据所包含的内容以及能够影响飞机爬升段油耗的相关因素,分析整理出6个影响油耗的特征指标:(1)爬升初始重量,以飞机的最初重量,减去开始爬升之前消耗的燃油重量约算出;(2)爬升距离,依据QAR中的经纬度参数求出每秒大圆距离,对其进行积分;(3)爬升时间,依据QAR数据进行飞行阶段的划分,直接提取时间参数;(4)平均爬升率,每分钟飞机爬升的高度,依据垂直速度计算;(5)最终爬升高度,爬升段结束时飞机上升的高度;(6)爬升段气象状态,包括温度、风速和风向。

2 PCA原理与BP神经网络

2.1 PCA原理

PCA方法是一种利用降维思想的多元统计分析方法,在损失很少信息的前提下,将多个特征指标转化为少数几个主成分,能够反映原始变量的大部分信息。各主成分互不相关,具有更优越的性能。采用该方法能够抓住研究问题的主要矛盾,使复杂的研究问题得到简单化,提高分析问题的效率。

设有p个特征指标,这p个指标构成p维的随机向量:X=[x1,x2,x3,…,xp]T

对X进行线性变换形成新的综合变量Y,满足:

2.2 BP神经网络

BP神经网络具有自适应、自组织、自学习的能力,并且有非局域性和非凸性的优点。BP神经网络模型输入层、输出层的个数分别由需要的输入变量个数、输出变量个数所决定,隐含层个数没有固定的解析式给出,一般由其自身的网络结构与数据特征所决定。同样的输出精度,相应的输入数据的关联性、耦合性越高隐含层神经元所需的个数就越多。

3 油耗模型建立原理

3.1 特征指标PCA

分析选取了6项特征指标,其中前5项指标的表现形式比较简明,第6项气象状态包含温度、风向和风速三个指标。这三个指标在爬升段存在的形式不稳定,但是温度、风向风速尤其是低空風切变对发动机的参数和状态影响较大,不能忽略,以三个指标在爬升段的起始值、最终值、最大值、最小值、均值和标准差作为分析依据,共有23项参数。

对提取的数据特征指标进行标准化。用PCA方法进行处理,求得其相关系数矩阵的特征值、特征向量、贡献率,并提取主成分。可知每一个特征值对应的贡献率,前6个主成分的贡献率共占84.90%,因此选取前6个主成分代替原来的23项特征指标进行数据分析。

3.2 BP神经网络油耗模型

结合3.1节,将6个主成分Y1、Y2、Y3、Y4、Y5和Y6作为输入参数,燃油的消耗量CF为输出。BP神经网络共有6个输入节点和一个输出节点,由于提取的主成分之间耦合关联较小,则隐含层需要n+n个神经元,n为输入变量的维数。最终构建6-12-1结构的BP神经网络进行建模分析。

3.3 仿真结果分析

将经过PCA计算后数据的80%作为训练样本,余下20%作为检验样本,创建结构为6-12-1的BP神经网络。以提取的6个主成分作为输入向量,燃油消耗为输出向量设置最大训练次数为10000,训练误差为0.0001,学习率为0.01。用总数据20%的检验样本检验经过训练的网络,结果见表2。其中模型先对误差为0.0152,标准差0.0159,拟合度为R^2=0.9752。检验结果表明,BP网络训练得到的油耗模型与实际油耗模型切合度很高,可以代替实际油耗模型进行因子分析。模型精度如表2所示。

本文选择了飞机爬升阶段的6个特征指标来分析对油耗的影响,可以将6个特征指标分为独立变量和相依变量两类。独立变量指该变量的数值不依其他变量的改变而改变,如平均爬升率仅由飞机爬升段的垂直速度有关,其值由设定量决定,变化比较单一。相依变量指变量数值的改变受其他多个参数的影响,如爬升距离由爬升时间、爬升率、最终爬升高度以及所选择的爬升路线共同决定所决定。

实际航班巡航段气象状况稳定,而爬升段飞机经历了从地面到巡航高度的过程,这一过程主要发生在对流层,对流层气象状况不稳定,其中温度基本以梯度形式减小,而风的变化情况不确定,再加上低空风切变对发动机参数的影响,使得飞机在爬升段油耗受风和温度的影响较大。分析结果具有一定的参考性。

4 结束语

(1)依据PCA方法对影响飞机爬升段油耗的相关特征指标进行处理,在保持84.90%贡献率的基础上,将23维的特征指标降低到6维。大大节省了存储空间与运行速度。

(2)将PCA方法与BP神经网络相结合,实现了复杂非线性关系的逼近,建立了高切合度的油耗统计模型。

本文采用固定机型飞机在某机场的起飞的大量数据进行统计分析。获得影响油耗的不同特征指标的微小变化对油耗的贡献率,可以为航空公司或者后续的研究提供参考,进一步合理规划航班,达到节能减排的目的。

参考文献:

[1]英国BP公司. BP世界能源统计年鉴2015[EB/OL]. http://www.bp.com/zh_cn/china /reports-and-publications/bp_2016.html.2016.

[2]穆阳.大力开展行业节能减排实现又好又快发展[J].中国民用航空,2009(4):21-22.

[3]陈静杰,肖冠平.飞机航段油耗区间估计最小样本量分析[J].计算机工程与设计,2014(12):4356-4359.

[4]林海明,杜子芳.主成分分析综合评价应该注意的问题[J].统计研究,2013,30(8):25-31.

[5]李朝静,唐幼纯,黄霞.BP神经网络的应用综述[J].劳动保障世界:理论版,2012(8):73-76.

猜你喜欢
BP神经网络主成分分析
就bp神经网络银行选址模型的相关研究
基于DEA—GA—BP的建设工程评标方法研究
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
BP神经网络算法在数值预报产品释用中的应用
服务贸易结构优化路径研究