ADS-B空中位置数据异常检测与统计分析

2022-04-07 12:51张思远郑佳雪沈笑云焦卫东
电光与控制 2022年4期
关键词:置信断点架飞机

张思远, 郑佳雪, 沈笑云, 焦卫东

(中国民航大学天津市智能信号与图像处理重点实验室,天津 300000)

0 引言

随着机载应答机系统的全面升级,基于广播式自动相关监视(ADS-B)的监视技术可以获得全空域几乎所有飞行器的实时数据,ADS-B数据在机场、航空公司和空管等民航众多领域有巨大的潜在应用价值。然而,ADS-B采用单向广播的方式使得接收端虽然可以轻易获取由飞机发出的报文信息,但却无法验证信息的准确性与可靠性,导致ADS-B技术在民航系统的推广和使用受到了一定的制约[1]。

数据异常检测是ADS-B安全领域的一项重要研究内容。2013年,英国牛津大学STROHMEIER等[2]综述了ADS-B安全领域的相关研究,将该领域分为两大类进行讨论,即安全广播授权和安全位置验证。安全广播授权是指ADS-B数据源必须是经过授权的安全目标,而非虚假目标,虚假目标发射的ADS-B伪数据对飞行安全的影响较大,相关的研究有很多。然而伪数据在真实环境中很少出现,目前的研究都是通过注入自定义的伪数据或直接修改原始数据来进行仿真验证,实际意义并不大。安全位置验证则是对真实的ADS-B数据尤其是空中位置数据的准确性进行验证,检测和识别ADS-B数据中与飞机实际飞行状况不符的数据,虽然对飞行安全的影响较小,但却具有很大的不确定性。2014年,ALI等[3]对伦敦终端区附近的ADS-B数据的准确性、完整性、延迟、可用性和更新率等指标进行评估;2017年,TABASSUM等[4]对福克斯机场接收的ADS-B数据的消息丢失、数据漏点、高度差异等异常情况的产生原因进行了分析。国内学者通常将ADS-B与航管雷达进行数据融合以实现二者的互补[5-7],但大多数空管系统只拥有其中的一种,而即便两者都有,通常也是主备关系,很少使用数据融合技术。还有一些学者采用航迹滤波的方式修正ADS-B数据中的跳点、断点等问题[8-10],但这种表面的修正并没有揭示ADS-B数据异常的严重性,也未能全面修正所有的ADS-B异常数据。

本文针对ADS-B数据中最重要的空中位置数据进行分析,以大量数据的TYPE值统计规律作为参考,在时间窗的约束下,组成置信数据集合,通过滑动时间窗,计算局部航迹曲率,检测并分类异常航迹点。通过对选取的30架飞机连续7 d的数据进行统计分析,得出目前ADS-B空中位置异常数据的统计结果,为ADS-B数据的实时检测和修正提供技术支持,并为ADS-B技术的快速推广和应用铺平道路。

1 机载原始数据TYPE值统计

机载S模式应答机发射的原始ADS-B数据为DF17格式,主要包括CA,AA,ME这3个字段:CA字段用于描述S模式应答机发射ADS-B消息的能力,以及位于空中还是地面;AA字段是ICAO为飞机分配的24位地址,也是每架飞机全球唯一不变的身份标识;ME字段是ADS-B消息中最核心的部分,其中包含了实际传送的有效数据。

每一条ADS-B机载原始数据传送不一定是同一种类型的数据,需要根据ME字段的前5位进行判断,这5位也被称为TYPE值,可表示的范围为0~31,主要对应8种不同类型的数据:1) 飞机ID与类型(TYPE1~4);2) 地面位置(TYPE5~8);3) 空中位置(TYPE9~18和TYPE20~22);4) 空中速度(TYPE19);5) 测试消息(TYPE23);6) 扩展间歇振荡器飞机状况(TYPE28);7) 目标状态与状况(TYPE29);8) 飞机运行状况(TYPE31)。

TYPE0为无法获得水平位置信息的空中或地面位置数据,TYPE24~27和TYPE30为预留消息。空中位置和地面位置对应多个TYPE值,不同的TYPE值可描述该位置信息对应的水平半径容限(Rc)。由于TYPE值与Rc并不是一一对应的,因此,ADS-B数据还使用了导航完整度类别(NIC)和NIC补充码对位置信息的准确性进行进一步描述。TYPE值越大,对应的NIC值越小,Rc越大,即位置准确性越差,可用性也越差。如果一个TYPE值只对应一个Rc,则无需NIC补充码,如果一个TYPE值对应多个Rc,则必须用到NIC补充码。此外,ADS-B还提供源完整性级别(SIL)数据来描述水平位置超出NIC半径容限的概率。但这3种数据只能给出大致的误差范围,在没有其他验证手段的情况下,无法清晰地描述飞机位置数据的实际异常情况。

表1是2020年连续7 d地面站收到的空中位置消息按TYPE值展开后进行统计的结果。

表1 空中位置数据按TYPE值展开统计Table 1 ADS-B class statistics by TYPE

由表1可知,接近90%的空中位置数据为TYPE11,其Rc理论上小于0.1 n mile(185.2 m)。随着TYPE值的增大,数据量越来越少,说明误差越大数据越少,但TYPE18的数据显著高于TYPE14~17,主要是由于TYPE18数据中包含很多无法判断位置精度的数据。

2 基于航迹曲率变化的空中位置异常数据检测

根据连续的空中位置数据可以绘制飞机的航迹,而间隔较小的空中位置形成的航迹曲线曲率接近常数,或者说曲率变化是很小的。根据这个原则通过对比任意相邻3个空中位置形成的2个线段斜率,可以分析和判断位置数据是否异常,如图1所示。

图1 航迹点和航迹角Fig.1 Track points and track angles

图1中,4个航迹点Pn-1,Pn,Pn+1,Pn+2构成了3段航迹线段,每个线段的斜率用航迹角Jn-1,Jn,Jn+1表示,而航迹角之差就反映了航迹曲线曲率的变化,如果航迹角之差较大,则说明曲线曲率变化较大,位置数据的准确性较差。曲率算式为

(1)

准确的曲率计算中,Pn+1Pn应使用弧线长度,由于ADS-B位置数据间隔时间较短,因此可用线段长度代替弧线长度。ADS-B数据最小速度变化为0.22 kn,统计显示,超过95%的相邻两点速度数据的差为0[11],因此,实际计算中可使用时间差来代替线段长度从而大幅提高计算速度。此时曲率算式可转换为

(2)

Zn虽然不是真正的曲率,但同样可以反映航迹曲率和曲率变化,在时间窗内选取曲率变化较小的若干个航迹点作为初始置信数据集合并计算其曲率平均值,然后计算时间窗内的所有航迹点数据与该平均值的平均绝对偏差,从而确定航迹曲率平均绝对偏差的变化阈值。平均绝对偏差既可以反映整体的离散程度,也可以检验新数据与置信数据集合的偏离程度,算式为

S={min(Zn)}T

(3)

(4)

式中:S表示置信数据集合;ZS为该置信数据集合的曲率平均值;B表示平均绝对偏差;T表示时间窗约束条件。由于ADS-B的数据间隔并不是固定不变的,航迹长度可能存在较大差异,所以并不适合使用固定数量的航迹点来进行曲率分析。采用时间窗约束后的航迹长度基本一致,便于在同一条件下设定阈值并进行曲率分析。利用置信集合内的航迹点验证新航迹点是否存在整体偏离,如果平均绝对偏差变化大于某一阈值,则认为存在航迹偏离。如果是正常航迹点,则滑动时间窗,剔除最旧的置信航迹点,增加最新正常航迹点,更新置信数据集合。

根据断点时间差、曲率变化和置信数据平均绝对偏差等结果,将所有空中位置数据分为正常航迹点数据、断点数据和异常数据3大类,由于断点只是两个相距较远的航迹点,本身不能算作异常数据,本文定义的异常数据包括以下5类。

1) 抖动点:曲率变化大于25°,飞机呈现S形运动,基本不符合飞机正常的飞行航迹曲线。

2) 横跳点:曲率变化接近90°,飞机呈现横向运动,完全不符合飞机正常的飞行航迹曲线。

3) 折返点:曲率变化大于90°,飞机呈现倒飞,完全不符合飞机正常的飞行航迹曲线。

4) 偏离点:曲率变化正常,但在时间窗内与置信样本集合偏差较大,体现为局部航迹偏离,不符合飞机正常的飞行航迹曲线。

5) 重复点:相邻两点位置数据完全相同。

重复点并不需要特殊检测算法,但这种数据的存在对于其他异常数据的检测有很大影响,必须在预处理阶段将其删除。由于重复点对ADS-B空中位置数据整体的有效性和可靠性具有统计意义,因此本文仍将其列为异常数据的一种进行统计分析。ADS-B空中位置数据的异常检测流程如图2所示。

图2 空中位置数据异常检测流程图Fig.2 Anomaly detection of air position data

由于ADS-B数据库存储地面站附近所有空中和地面飞机广播的ADS-B数据,因此首先必须根据飞机的AA身份从数据库中提取并单独存储其中的TYPE9~18的空中位置数据,然后标记并删除重复点数据,根据相邻两点数据的时间差判断其是否为断点数据,计算航迹曲率并根据曲率变化判断其是否为抖动点、横跳点或折返点数据,在时间窗的约束下,根据与置信数据集合的航迹曲率平均绝对偏差判断其是否为偏离点数据,如果不是,则最终判定为正常数据,并更新置信数据集合。

3 仿真分析

根据表1的统计结果,同一架飞机的连续两条ADS-B空中位置数据平均间隔约为0.8 s。断点的时间差阈值通常设定为20 s,为了保证置信集合内至少有10个以上的正常数据,并能够跨越间隔较大的数据点以及偏离点数据,时间窗通常选取40~60 s。

为使仿真分析具有代表性,选取了连续7 d都出现在地面站监视范围内且数据量较大的30架飞机作为分析对象,其中11架为在某机场起降的飞机,另外19架为过境飞机。以AA值为7808F3的飞机为例,该飞机在一天中两次在该机场起降,形成的航迹曲线见图3。

图3 7808F3的全天空中航迹Fig.3 All-day air track of 7808F3

图3是根据7808F3的原始数据绘制的空中航迹曲线,通过异常数据检测,在图中标注出各种异常数据,包括57个断点,1个抖动点,4个横跳点,2个折返点和10个偏离点,没有出现重复点,将图3中的异常数据进行局部放大如图4所示。

图4 7808F3的各种异常数据Fig.4 Different types of abnormal data of 7808F3

将选定的30架飞机以同样的方式检测并统计其连续7 d空中位置数据中存在的5种异常数据,由于实验采用单地面站接收数据,而断点主要发生在ADS-B地面站的监视边缘,因此统计意义不大。统计结果显示,除了偏离点外,TYPE值基本不能用于识别异常数据,即使是精度较好的TYPE11的空中位置数据也可能出现异常数据。30架飞机中只有1架飞机同时出现了这5种异常数据,AA身份为7813E5,观察发现该飞机所有的空中位置数据的TYPE值都是18,推断其自身的定位设备存在故障。不考虑7813E5这种存在故障的飞机,其余29架飞机的空中位置数据大部分是TYPE11或TYPE12,少量飞机有高TYPE值数据,对这29架飞机的5种异常数据进行飞机数量和数据量的单项统计,结果如图5所示。

图5 异常数据单项统计Fig.5 Individual statistics of abnormal data

图5中折返点的数据量占比和出现的飞机数量都是最高的,抖动点和横跳点的数据量占比不大,但出现的飞机数量接近一半,重复点的数据量占比仅次于折返点,但出现的飞机数量较少,而偏离点无论是数据量还是飞机数量都是最小的。所有异常数据量占总数据量的1.59%,也就是说每100条空中位置数据中就有1.59条异常数据,虽然占比很小,但还要看这些异常数据的分布情况,如果过于集中依然会对航空安全运行产生一定影响。表2是单位时间内异常数据占比超过25%的情况统计。

表2 异常数据连续性统计Table 2 Continuity statistics of abnormal data

注:N/A表示不适用。

由表2可知,排除7813E5的特殊情况,这7 d的数据中只有1架飞机的异常数据持续时间超过1 min,AA身份为780525,异常数据占比达到了40%,大于10 s小于1 min的有5架,其余23架飞机异常数据持续时间都小于10 s。

4 结论

本文将ADS-B空中位置数据分为正常数据、断点数据和异常数据,对实际接收的连续7 d的ADS-B数据进行了异常数据检测、识别和统计分析,得出以下结论:

1) 各种异常空中位置数据相对整体数据量来说占比较小,约为1.59%;

2) 折返点数据是最常见的异常数据,几乎所有飞机都存在这类数据;

3) 重复点数据并不常见,但个别飞机会出现大量该类数据;

4) 约半数飞机会出现横跳点或抖动点数据,但数据量并不大;

5) 偏离点数据最罕见,通常只有TYPE18的数据中会存在该类数据;

6) 如果飞机全部空中位置数据的TYPE值都是18,则无法用于正常的空管监视;

7) 单位时间内占比超过25%的异常数据很少且持续时间很短,但仍会有极少数超过1 min的情况。

下一步研究工作将针对异常数据的时空统计规律和分布特点,分析其产生的原因以及对空管监视和航空安全的影响程度。

猜你喜欢
置信断点架飞机
断点
融合有效方差置信上界的Q学习智能干扰决策算法
置信职业行为在护理教育中的研究现状
基于模糊深度置信网络的陶瓷梭式窑PID优化控制
用Eclipse调试Python
火力发电机组自启停(APS)系统架构设计方案
一类无限可能问题的解法
透视:牛奶盒,起飞!
基于深度置信网络的近距空战态势评估
乘坐飞机