航空器进场盛行轨迹挖掘及特征分析

2020-10-28 02:36刘芳子
关键词:手肘进场航空器

吴 迪,羊 钊,刘芳子,王 兵,黄 明

(1.苏州规划设计研究院股份有限公司常熟分公司,苏州215500; 2.南京航空航天大学 民航学院,南京210000;3.中国民用航空局空中交通管理局,北京100022;4.中国民用航空珠海进近管制中心,珠海519000)

在民航运输过程中,空中交通管制员可以快速获取一系列航空器运行的实时位置坐标,从而得到航空器的飞行轨迹.飞行轨迹聚类是分析轨迹问题的一种有效方法.通过对航空器飞行轨迹的聚类分析,可以得到中心轨迹,识别盛行交通流,鉴别异常轨迹,辅助飞行程序设计,并帮助航空公司了解航班的运行情况,合理调整飞行计划.

目前国内外学者关于飞行轨迹聚类方法开展了大量研究.例如,王增福等[1]基于平面坐标数据,提出基于减法聚类的自适应轨迹聚类算法;Frank等[2]提出基于轨迹点比对的轨迹聚类方法;Gariel等[3]通过轨迹数据进行聚类分析,提出基于最长公共子序列的相似性度量算法.Lee等提出了基于轨迹离群点的分割异常检测,并分为一个两层的轨迹划分策略和混合使用给予距离和密度的检测方法[4];并通过研究轨迹相似性度量方法在异常检测及异常偏差的应用,分析聚类方法的有效性以及其时间成本,并应用于海岸监控方面[5-6];Piciarelli等分析了轨迹聚类并应用在视频监控上[7];Jasse等使用聚类方法分析飞机飞行数据,并应用于飞机异常轨迹监测[8];Eckstein等研究了自动的轨迹分类[9];Vlachos等研究发现了多维轨迹的相似性度量算法[10].王超[11]等提出了根据轨迹聚类集构造平均轨迹的方法,并改进了Frank的算法.为指导飞行程序的改善和发现管制员的指挥模式,王超等[12]在分析历史轨迹的基础上,对轨迹特征点进行划分,提出了基于改进的模糊C_Means轨迹聚类方法.王涛波等[13]采用模糊聚类算法,分析平均中心轨迹对进离场飞行程序设计优化的影响.马广辉等[14]在采用欧式距离对历史轨迹进行聚类分析的基础上,设计出符合航空器在终端区运行的多条水平进场路径.

尽管国内外学者关于轨迹聚类已开展大量研究,但现有文献中在聚类过程中主要依赖于经纬度数据,而高度数据多用于确定轨迹特征点.此外,现有研究较少涉及聚类中心轨迹在不同时间段的差异性.受不同时段空域拥挤程度、临时航线使用等因素的影响,航空器绕飞、等待、延误、变更航线等会对实际聚类中心产生较大影响.鉴于此,本文采集航空器进场轨迹数据,采用K-means聚类方法挖掘航空器飞行中心轨迹,并对比其在不同时间段的差异.

1 数据选取及处理

本文采集上海虹桥机场(ZSSS)—北京首都国际机场(ZBAA)ADS-B数据进行聚类分析.将轨迹数据按照白天(8:00~20:00)和夜间(20:00-次日8:00)时间段进行划分,通过数据预处理,筛选得到40条进场轨迹数据,每条轨迹采用气压高度为5 700 m以下的100个特征点反应轨迹特征.根据ADS-B数据来看,一条航班信息的更新间隔通常在4 s到几分钟不等,由航班唯一识别码(VFID)、航班呼号(CallSign)、航空器型号(AcfType)、经度(Longitude)、纬度(Latitude)、气压高度(Height)、地速(Speed)、起飞机场四字码(Depaddr)、降落机场四字码(Arraddr)、监视时间戳(Monitor Time)等有效字段组成.航空器运行轨迹可表示为:

表1 航班ADS-B数据示例

A={A1,A2,…,Ai,…,An}

(1)

其中:Ai为一条航空器的轨迹,i∈[1,n],n为进场轨迹的总条数.

每条轨迹数据都是由多个轨迹点组成的,且每条轨迹的航迹点总数量不同,因此,可将Ai表示为:

Ai={mi1,mi2,…,mij,…,min}

(2)

其中:i为航空器的识别码,n为进场航空器对应的轨迹总数量.每一个航迹点mij定义为一个四维向量即:

mij={Xi,Yi,Zi,Ti}

(3)

其中:Xi、Yi、Zi、Ti分别表示第i条轨迹中航迹点的横坐标经度、纵坐标纬度、飞行高度和航迹点监视时间戳.

由于ADS-B数据是通过自动广播机载设备将航空器的识别信息自动传输给地面设备,受信号遮挡、干扰,接收站不同等多种因素的影响,需要对数据进行预处理.数据预处理主要包括去除重复的航迹点、修正或删除异常点、轨迹校准.根据航班的ADS-B经度、纬度和高度数据,会出现离群点,在聚类过程中需要将这些点剔除.

2 基于K-means的航空器进场轨迹聚类

聚类算法是数据挖掘中的一种基础算法.将具体或抽象的数据集对象划分成若干个簇,使得划分后的数据集尽可能相似.本文采用聚类算法将轨迹数据根据不同特性分成多个类别.基于现采集的40条轨迹数据,为对比不同时间段内航空器进场飞行轨迹的差异,本文以白天(8:00~20:00)和夜间(20:00~次日8:00)为例,采用K-means算法对于该时间段内轨迹数据进行聚类分析.首先根据每一个簇中对象的平均值(即簇的质心)来计算对象与簇之间的距离,具体过程描述如下:

1)由于每条轨迹数据均由多个轨迹点构成,且每条轨迹的航迹点数量各不相同,需要对数据进行预处理.将每条轨迹数据规范为由同等数量的航迹点构成,用K表示初始聚类类别数,同时随机选择K个数据对象作为初始的簇中心;本文采用手肘法和轮廓系数法等来确定合适的K值.手肘法[15]是一种利用SSE(Sum of the Squared Errors,误差平方和)和K值的关系图确认最优K值的方式,SSE可替换为样本点到聚类中心欧式距离平均值.在聚类过程中,K值越大,数据被分割得越详细,此时误差平方和不断减小.手肘法的思想是当K值小于真实聚类数时,随着K值的增大,SSE的变化幅度会很大;当K达到真实聚类数目时,随着K的增大,SSE的变化关系图会趋于平缓.所以当手肘法所绘制的折线图,夹角最小时,数据K值为数据的最优聚类数.手肘法步骤如下:

①输入20组轨迹数据;

②根据K-means确定K值的大致取值范围,本文在算法中选取1~10;

③进行所有K值的聚类;

④采用下式计算误差平方和:

(4)

其中:Zi是第i个簇,p是Zi中的样本点,Li代表Zi的质心,代表所有数据对象的平均表值,k代表分组类别数.输出所有K值与其对应的误差平方和;

⑤绘制二维图形,确认最优K值.

2)计算轨迹数据中的每个对象与各质心之间的欧氏距离,将其划分到与其距离最近的簇;重新计算每个簇的质心.其中距离计算公式为:

(5)

其中:mir为轨迹Ai上的一点,mjr为轨迹Aj上的一点,D为轨迹Ai与轨迹Aj上两点之间的欧氏距离.

3)判断准则函数收敛是否收敛,如果不收敛,算法跳转至第②步;否则算法结束.

3 结果分析

采用K-means聚类算法将给定的N条轨迹数据对象分成K个簇,通过手肘算法确定最佳类别数目,可以得出最优轨迹类别数目下的四维轨迹聚类.

在北京首都国际机场,航空器在进场阶段,从JB NDB台开始执行ZBAA STARRWY18R/18L/19进场程序,通过该台高度(L)为5 700 m,通过JR NDB台的高度(L)为5 400 m,沿该台6°方位线飞至HUR VOR/DME 台276°径向线,高度(A)为2 400 m,距离HUR台55.93 km,右转沿KM NDB台100°方位线直飞,再切HUR280°径向线处到达IAF,此处距离HUR台40.74 km,高度(A)为2 100 m.

基于ADS-B数据,选取并处理进场轨迹共40条,处理异常轨迹与离群点,查找是否有明显的数据缺失情况.并根据时间分为两组各20条数据,并采用上文所述方法,在Matlab中实现.结果如图1所示.

图1 8:00~20:00 轨迹欧氏距离手肘图

图1为白天(8:00~20:00)时间段轨迹欧氏距离手肘图,其中横坐标表示聚类个数K,纵坐标表示误差平方和SSE,当K值小于如图所示最优聚类数3时,随着K值的增大,手肘图所示两点间的连线较为陡峭.当K=3时,随K值变大,手肘图所示纵轴两点间的连线呈下降趋势且逐渐趋于平缓.拐点处所对应的值,即K=3,为8:00~20:00的轨迹数据聚类时的最优类别数.

图2 20:00~次日8:00 轨迹欧氏距离手肘图

图2夜间(20:00~次日8:00)时间段轨迹欧氏距离手肘图,当K值小于2时,随着K值的增大,手肘图所示两点间的连线较为陡峭.当K=2时,随K值变大,如手肘图所示,横坐标数值越来越大是时,SSE呈下降趋势,两点之间的连线夹角越来越大,直到夹角接近或超过180°.因此,20:00~次日8:00的轨迹数据聚类最优K值为2.

图3为白天(8:00~20:00)时间段轨迹聚类中心图,其中X轴与Y轴分别表示其中X轴与Y轴分别表示航空器经度和纬度的飞行位置,Z轴表示航空器飞行高度.

图3 8:00~20:00聚类轨迹图

图4 20:00~次日8:00聚类轨迹图

对比图3中的3条聚类中心航可以看出第一类中心轨迹与第二类中心轨迹和第三类中心轨迹偏差较大,该时间段内,空域相对繁忙,考虑管制员负荷等原因航空器容易发生绕飞或等待.图4为夜间(20:00~次日8:00)时间段轨迹聚类中心图,与图3相对比,由于夜间航空器绕飞少,两类中心轨迹趋势较为一致.

4 结 语

本文采用轨迹聚类分析方法对不同时间段的同一跑道进场航班的历史轨迹数据进行分析.通过对轨迹数据的经纬度、高度及监视时间的四维数据进行处理,提取特征点,采用K-means方法聚类出航空器运行的中心轨迹,并对比分析不同时间段聚类中心轨迹之间的差异.以白天(8:00~20:00)和夜间(20:00~次日8:00)为例进行时间段划分.研究结果表明,航空器实际运行会因为空域拥挤程度、临时航线使用等因素的影响,产生绕飞、等待、延误、变更航线等行为,对实际聚类中心产生较大影响.因此,在对航空器飞行中心轨迹聚类过程中加入时间划分会提高聚类的准确性.本文采用的时间划分聚类方法对轨迹数据的依赖性比较高.未来的研究需要进一步增加实验数据,提高数据质量,以计算出更符合航空器实际运行的中心轨迹.

猜你喜欢
手肘进场航空器
基于层次聚类的航空器群识别方法
沪指筑底 稳步进场
泸指v型逆转 进场机遇可期
基于ADS-B的航空器测高系统误差评估方法
可重复使用飞行器进场着陆拉平纵向控制
航空器的顺风耳——机载卫星通信
火星航空器何时才能首飞
简历