基于贝叶斯网络的空中交通延误传播分析

2013-07-02 01:45赵嶷飞马乐川王红勇中国民航大学天津市空管运行规划与安全技术重点实验室天津300300
中国民航大学学报 2013年1期
关键词:离场时间段贝叶斯

赵嶷飞,马乐川,王红勇(中国民航大学天津市空管运行规划与安全技术重点实验室,天津 300300)

基于贝叶斯网络的空中交通延误传播分析

赵嶷飞,马乐川,王红勇
(中国民航大学天津市空管运行规划与安全技术重点实验室,天津 300300)

从机场网络的角度研究延误传播问题。贝叶斯网络是一种分析传播问题的有效方法,基于贝叶斯网络的延误模型,构造出延误传播的机场网络模型。通过计算网络中条件概率,最终得到联合概率,用于分析机场之间延误传播的影响。实验数据表明,当某一机场产生离场延误时,这一延误不会消失,而是经过时间的推移传播到其他机场,造成其他机场的延误。

贝叶斯网络;航班延误;延误传播

随着中国民航事业高速发展,机场吞吐量与航班量大幅度增加,导致全国范围内的机场均有航班延误现象发生。航班流量大的机场,由于空域和机场资源限制,是航班延误问题多发区。航班班次排名前10的机场,几乎同时也是航班延误排名前10的机场。这些机场起降的航班数量约占全国航班总量的50%,却占据不正常航班中的81%。由于全国大部分机场的延误直接或间接受到这些机场的影响,因此,研究枢纽机场的延误成为减少航班延误的关键。近十年来,航班延误及其波及分析模型成为民航领域的一个研究热点。Clarke和Abdelghany分别于1997年和2004年提出了各自的延误波及分析模型,两个模型对由于GDP (ground delay program)或者其他因素引起的航班延误的后续波及进行了分析[1]。目前国内研究航班延误主要从航空公司角度出发,通过收集整理某一航空公司所有航班的运行数据,运用延误模型进行分析。

本文从机场运行的角度出发,选择机场间延误航班作为研究对象。通过处理全国航班时刻,筛选出北京、上海、广州3大机场的到港延误、离港延误的时间。通过构建贝叶斯网络,综合先验知识和延误样本数据,计算出联合概率分布表,通过数据量化出广州、上海2个机场的离场延误对于北京首都机场到港延误的影响。研究结果有助于挖掘机场之间延误传播的内在机理,实现延误传播的科学预测,为及时、科学的实施延误管理提供依据。

1 贝叶斯网络

1.1 基本概念

贝叶斯网络(BN)是一种基于网络结构的有向图解描述,是用来表示变量集合连接概率的图形模型,适用于表达和分析不确定和概率性事物,可从不完全或不确定的知识或信息中做出推理。一个贝叶斯网络是一个有向无环图(directed acyclic graph,DAG),由代表变量节点及连接这些节点有向边构成。节点代表随机变量,节点间的有向边代表了节点间的相互关系(由父节点指向其后代节点),用条件概率进行表达关系强度,没有父节点的用先验概率进行信息表达。节点变量可以是任何问题的抽象,如测试值、观测现象、意见征询等[2]。

1.2 贝叶斯网络的特点

根据其基本原理,贝叶斯网络具有如下特点[3]。

1)贝叶斯网络具有坚实的概率理论基础,同时具有直观的知识表示形式。

2)贝叶斯网络与一般知识表示方法不同,它是对于问题域的建模。因此当条件或行为等发生变化时,不用对模型进行修正。

3)贝叶斯网络能够处理不完备数据集。贝叶斯网络反映的是整个数据域中数据间的概率关系,即使缺少某一数据变量仍然可以建立精确的模型。

4)贝叶斯网络是根据因果关系进行学习的。在数据分析处理中获得变量域的理解,便于处理各种不确定性信息。

5)贝叶斯网络与贝叶斯统计相结合能够充分利用领域知识和样本数据的信息。

综上所述,应用贝叶斯网络建模进行数据分析,能够很好地解决民航数据普遍存在的信息量大、有缺失、直观因果关系不明确、知识隐藏等问题。

2 基于贝叶斯网络的航班延误模型

建立航班延误的过程实际上就是构造贝叶斯网络的过程。构造贝叶斯网络一般分为3个步骤[4]:①确定变量集及其对应的值域;②确定网络结构,即给出有向无环图Г;③给出局部概率分布P(Xi|Π(Xi)),它表达了节点同其父节点的相关关系——条件概率,没有任何父节点的条件概率为其先验概率。这3个步骤通常是交叉进行,而不是简单地按顺序完成。下面具体描述基于贝叶斯网络的航班延误模型的建立。

2.1 数据定义

根据中国民航局《民航航班正常统计办法》,在班期时刻表公布的离站时间后15 min(北京、浦东、广州以及境外机场30 min,虹桥、深圳机场25 min,成都、昆明机场20 min)之内正常起飞未发生返航、改航和备降等不正常情况的航班;在班期时刻表公布的到达时间前后10 min之内落地的航班,均属于正常航班。不符合正常航班条件的航班为不正常航班[5]。

本文采用飞友网提供的全国某天航班实际运行数据,并进行预处理:第1步,由于北京、上海、广州是我国3大枢纽机场,三大机场之间的延误传播现象更为明显,因此选其为研究对象;第2步,筛选出3大枢纽机场的进、离港航班时刻;第3步,分别对进、离港航班的延误时间进行统计,实际起飞时间大于计划起飞时间30 min即为离场延误,实际到达时间大于计划到达时间10 min即为进场延误,计算实际飞行时间,计算出平均航路飞行时间。

2.2 航班延误模型的变量及其对应的值域

通过分析,可知北京发生到达延误是多个因素共同作用的结果。因此,在建立延误模型时,选取广州至北京航班的离场延误、上海至北京航班的离场延误、时间段作为北京到达延误的影响因素,其相应的变量集[4]确定如下

X={ZGGGDepDelay,ZSSSDepDelay,T};

其中,ZGGGDepDelay表示广州至北京航班的离场延误,ZSSSDepDelay表示上海虹桥至北京航班的离场延误,T表示时间段。

各变量对应的值域分别为

ZGGGDepDelay:{<=30 min,30~60 min,60~90 min,>90 min};

ZSSSDepDelay:{<=30 min,30~60 min,60~90 min,>90 min};T:{8:00—10:00,10:00—12:00,12:00—14:00,14:00—16:00,16:00—18:00,18:00—20:00,20:00—22:00,22:00—24:00}

模型中的变量及其对应值域是在分析目前对北京到达延误及其各成因之间关系的研究成果的基础上确定的。

2.3 延误模型的网络结构

根据上述模型变量之间的相互关系,将贝叶斯网络与航班延误模型相结合,该模型的网络结构描述如图1所示[6]。

图1 延误模型网络结构Fig.1 Net structure of delay model

图1中每个节点表示一个变量,节点之间的有向弧表示各变量之间的因果关系。

2.3.1 时间段与广州离场延误之间关系

将时间段与广州离场延误关系从图1中分离出来,如图2所示。

图2 时间段与广州离场延误之间的关系Fig.2 Relationship between time slot and Guangzhou departure delay

在本文所建立的航班延误模型中,根据已确定的模型变量及其对应值域可知,广州离场延误有4个值,时间段有8个值,则两者之间的条件概率表中会出现4×8种条件概率。得到时间段与广州离场延误之间的条件概率如表1所示。

表1 广州离场延误与时间段的条件概率Tab.1 Conditional probability of Guangzhou departure delay and time slot

2.3.2 时间段与上海离场延误之间关系

将时间段上海离场延误关系从图1中分离出来,如图3所示

图3 时间段与上海离场延误之间的关系Fig.3 Relationship between time slot and Shanghai departure delay

根据已确定的模型变量及其对应值域可知,上海离场延误有4个值,时间段有8个值,则他们两者之间的条件概率表中会出现4×8种条件概率。得到时间段与上海离场延误之间的条件概率如表2所示。2.3.3 时间段与北京到达延误之间关系

将时间段与广州、上海至北京到达延误关系从图1中分离出来,如图4所示。

根据已确定的模型变量及其对应值域可知,时间段有8个值,北京到达延误有5个值,则两者之间的条件概率表中会出现5×8种条件概率。得到北京到达延误与时间段之间的条件概率如表3所示。

表2 上海离场延误与时间段的条件概率Tab.2 Conditional probability of Shanghai departure delay and time slot

图4 时间段与北京到达延误之间的关系Fig.4 Relationship between time slot and Beijing arrival delay

表3 北京到达延误与时间段的条件概率Tab.3 Conditional probability of Beijing arrival delay and time slot

2.3.4 延误模型联合分布下的条件概率

获取延误模型在上述3个影响因素联合分布下的条件概率,实质上是一个贝叶斯学习的过程。具体推导概率p(d|ZGGGDepDelay,ZSSSDepDelay,T)的求法如下[4]:

对(1)式中的p(ZGGGDepDelay,ZSSSDepDelay,T|d)运用条件独立性,得到:

由(2)式可知,要计算概率p(d|ZGGGDepDelay,ZSSSDepDelay,T)的值,需要知道某些先验概率及条件概率。通过已经处理好的3大机场延误时刻数据进行分析,还需要北京机场各个时间段延误的概率分布,在表4中列出。

表4 北京机场各个时间段延误的概率分布Tab.4 Probability distribution of every time slot in Beijing airport

根据已确定的网络结构,利用局部概率分布可以得到网络中各变量间的联合概率分布。就本网络而言,各变量间的联合概率可以表示如下:

3 模型验证

通过上述计算好的联合概率分布,可以求出p(d,ZGGGDepDelay,ZSSSDepDelay,T)。由于上海至北京的平均飞行时间为1 h 45 min;广州至北京的平均飞行时间为2 h 45 min,因此,应基于飞行时间选择时间段。本文中,若计算北京某一时间段内到达延误发生概率,对应的由上海始发航班向前推一个时间段,广州始发航班向前推两个时间段。若选择8∶00—10∶00时间段,由于在此之前,广州、上海没有航班起飞,因此北京到达延误的概率为零。

下面通过一个实际算例来说明计算过程。

上海离场正常(<30 min),广州离场正常(<30 min),通过查询各属性的条件概率表,在各个时间段北京到达正常(<10 min)的概率如下:

由上述概率可以看出,当上海、广州离场都正常,到达北京的航班在12:00—14:00这个时间段内正点的概率为0.8%,而在14:00—16:00这个时间段内正点的概率为56.7%。

通过反复的计算,就可以知道网络中任意传播概率。由于篇幅限制,以下仅列出部分概率表。

1)当上海离场正点时,广州离场延误时间为30~60 min,北京到达延误时间为20~30 min,各时间段的概率,如表5所示。

表5 概率分布1Tab.5 Probability distribution No.1

2)当广州离场正点时,上海离场延误时间为30~60 min,北京到达延误时间为20~30 min,各时间段的概率,如表6所示。

表6 概率分布2Tab.6 Probability distribution No.2

3)当上海、广州离场延误时间均为30~60 min,北京到达延误时间为10~20 min,各时间段的概率,如表7所示。

表7 概率分布3Tab.7 Probability distribution No.3

4)当上海、广州离场延误时间均为30~60 min,北京到达延误时间为20~30 min,各时间段的概率,如表8所示。

表8 概率分布4Tab.8 Probability distribution No.4

表5表示不考虑上海离场延误,只考虑广州离场延误对于北京到达延误的影响,在16∶00—18∶00这个时间段内,北京到达延误受到的影响最大。而在这个时间段内到达北京的航班,其起飞时间应在12:00—14:00,而通过对比实际航班信息,在这个时间段中,广州至北京航班中发生离港延误,从而导致北京到达的延误。

表6表示不考虑广州离场延误,只考虑上海离场延误对于北京到达延误的影响,在14:00—16:00这个时间段内,北京到达延误受到的影响最大。而在这个时间段内到达北京的航班,其起飞时间应在12:00—14:00,而通过对比实际航班信息,在这个时间段中,上海至北京航班中大部分发生离港延误。

表7、表8表示当上海、广州离场均发生延误时,在各个时间段,北京发生轻度到达延误与中度到达延误的概率。从表中可以看到,在18:00—20:00这个时间段内,北京同时受到上海与广州离场延误的影响最大。

通过以上数据分析,可以得出以下结论:当起飞机场产生离场延误,这些延误不会消失在航路上,而是会随着时间的推移,沿航路传播到下一个节点——目的地机场,造成目的地机场产生到达延误。由于在不同的时间段内,起飞机场产生的离场延误等级不同,因此会影响到到达延误的等级。

4 结语

通过建立贝叶斯网络,可以分析2个甚至多个机场之间离场航班延误对到达航班延误的影响。贝叶斯网络模型不仅具有严格的概率理论基础,而且其网络结构也可以将各元素之间的关系直观地表示出来,能够清晰准确地分析延误传播情况。

本文通过对北京、上海、广州3大枢纽机场到达延误与离港延误数据统计;通过学习贝叶斯网络,建立到达延误与离港延误的网络结构,计算出各种情况下概率值,从而对北京的到达延误受到的影响进行分析。进而得出结论:当某一机场产生离场延误时,这一延误不会消失,而是经过时间的推移传播到其他机场,造成其他机场的延误。

[1]徐 涛,丁建立,王建东,赵学健.基于贝叶斯网络的航班延误与波及分析模型[J].系统仿真学报,2009,15(21):4818-4822.

[2]何丕廉,刘玉洁.基于贝叶斯网络的航班延误与波及预测[D].天津:天津大学,2009.

[3]曹卫东,丁建立,刘玉洁.基于贝叶斯网络的航班离港延误预警分析[J].计算机应用研究,2008,11(25):3389-3390.

[4]黄席樾,刘 利.道路交通事故统计分析及预测模型研究[D].重庆:重庆大学,2004.

[5] 中国民用航空局.航空发(2003)96号,民航航班正常统计办法[S]. 2003.

[6]XU N,DONOHUE G,LASKEY K B.Estimation of delay propagation in the national aviation system using Bayesian networks[J].USA/Europe Air Traffic Management Research and Development Seminar,2005,1-11.

[7] 李俊生,丁建立.基于贝叶斯网络的航班延误传播分析[J].航空学报,2008,6(29):1598-1604.

(责任编辑:黄 月)

Analysis of air traffic delay propagation based on Bayesian networks

ZHAO Yi-fei,MA Le-chuan,WANG Hong-yong
(Tianjin Key Laboratory for Air Traffic Operation Planning and Safety Technology,CAUC,Tianjin 300300,China)

Based on Bayesian networks delay model,is the delay spread airport network modelis.By calculating the conditional probability of network,finally get the joint probability,is used to analyze the effects of delays propagation between the airport.The experiment data show that,when an airport departure delays produced,the delay will not disappear,but after a time spread to other airports,causing other airport delays.

Bayesian networks;flight delay;delay propagation

V351

A

1674-5590(2013)01-0027-05

2012-05-04;

2012-08-10

国家科技支撑计划项目(2011BAH24B10);国家自然科学基金(60832011);中国民用航空局科技基金项目(MHRD201018);中央高校基本科研业务费专项(ZXH2009A004,ZXH2010C010)

赵嶷飞(1971—),男,湖南常德人,教授,博士,研究方向为空中交通规划与管理.

猜你喜欢
离场时间段贝叶斯
基于CE-PF算法的舰载机离场调度优化问题
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
夏天晒太阳防病要注意时间段
一场史无前例的乐队真人秀
新闻事件中的“离场”介入”现象浅析
我喜欢我们K歌的那个晚上,没有一个人离场
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
发朋友圈没人看是一种怎样的体验