基于AIS数据的船舶航线分析研究*

2022-11-05 10:52冯俊池安丰亮
舰船电子工程 2022年9期
关键词:航迹航行控制点

冯俊池 刘 海 安丰亮

(军事科学院系统工程研究院后勤科学与技术研究所 北京 100071)

1 引言

船舶AIS(Automatic Identification System,自动识别系统),是由舰船、飞机之敌我识别器发展而成,应用于船和岸、船和船之间海事安全与通信的数字助航系统[1]。AIS系统配合全球定位系统将船位、船速、航向等船舶动态结合船名、呼号、吃水等船舶静态资料向附近水域船舶及岸台广播,可用于船舶信息数据的采集,保障海上航行安全[2~3]。针对特定船舶的航线分析可识别其行为及位置,建立船舶画像,对检测船舶行驶异常[4~5]、预测船舶位置[6],具有重要意义;通过针对指定区域内的船舶进行航线分析,可了解该区域内航线情况,为航线规划[7]提供参考依据。本文针对船舶航线识别分析需求,基于船舶AIS位置数据,通过航行区间判断、航线数据聚类、航线分析生成等流程,提出船舶航线生成方法;并针对所生成航线,给出误差距离和航线控制点数量2类评价指标,用于航线优劣验证和评估。

2 AIS数据预处理

2.1 数据描述

AIS数据内容包括静态信息、动态信息、航行相关信息以及与安全有关的短消息等,船舶在航时,动态位置数据以最快2s、最慢3分钟1次的速率发送[8]。静态信息包括船舶MMSI(Maritime Mobile Service Identify,海上移动业务识别码)、IMO(International Maritime Organization,国际海事组织)编号、船舶呼号、船舶名称、船舶类型、船长、船宽等;动态信息包括经度、纬度、定位时间、航向、转向率、航速、航行状态等;航行相关信息包括目的地、预计到达时间等。部分字段信息说明如表1所示。

表1 AIS数据部分字段说明

2.2 数据清洗

由于干扰等各种因素的影响,AIS数据中会存在部分不规范的错误数据[9~10],因此需要对数据进行清洗处理。主要针对明显错误的数据采取删除及补全等处理措施,相关规则如表2所示。

表2 AIS数据清洗判断规则

2.3 数据筛选

针对船舶的航线进行分析,需要获取一定时期内该船舶的全部位置数据。通过船名、MMSI或IMO编号筛选目的船舶的位置数据,由于AIS数据规模庞大,可采用Map Reduce框架[11]实现并行处理,提高效率。针对某个区域内船舶航线进行分析的情况下,首先确定位置在该区域内的船舶,然后针对相关船舶进行位置数据的筛选。为便于后续处理,可通过判断航行状态和航速参数,剔除指定船舶位置数据中开始和结束阶段的非完整航线数据。

3 船舶航线分析生成

针对某一时期的航行数据,首先筛选出属于特定航线的船舶航行区间,然后针对特定航线进行分析,将属于该航线的航行区间AIS数据进行叠加,从中连续提取一定区域内的位置中心点,最后连接所有中心点,即得到该条船舶航线。

3.1 航行区间获取

首先,通过航行状态和航速字段确定船舶是否运行;然后,为避免船舶停留在港内以及数据不准等情况影响,采用位置距离矩阵分析判断船舶启航情况,获取船舶航行轨迹的起点和终点;最后,针对起点和终点集合进行聚类,获取属于同一航线的航行轨迹起点和终点集合。

3.1.1 位置距离矩阵

位置距离矩阵描述了船舶位置点之间的相对距离,如图1所示,其中行号和列号代表位置点编号,对应行和列的数据值则代表了两个位置之间的距离。其中的每一行数据分别代表了该位置点与前面位置点的距离,在正常航行中,一般为递减序列。

图1 位置距离矩阵

假设某点为船舶航行起点,则以该点开始,后续位置点与该点距离应不断增大。在图1中,在第7个点之前,如前5行数据所示,每个位置点之间距离均在很小范围内变化,从第7个点开始,即第6行数据,与前6个点距离均明显增加,因此,将第6个点视为船舶起点。船舶终点位置分析与之类似。

3.1.2 船舶航行起终位置生成

船舶航行起终位置生成算法如表3所示。

3.1.3 航线数据筛选

航线数据筛选算法如表4所示。

表4 船舶航线数据筛选算法

3.2 航线生成

在获取属于同一航线的船舶航行区间后,将其位置数据进行叠加,分别取所有的开始位置和结束位置的地理中心点确定开始点和结束点,并按一定距离间隔D取位置集合范围的地理中心点,作为航线上的控制点,其中包含了航线必经的关键转向点[12],将得到的控制点连接即为船舶航线。具体算法如表5所示。在求解地理中心点时,将每个经纬度转换为三维空间坐标,计算坐标系中心点并转换为经纬度。

表5 船舶航线生成算法

4 航线评估

船舶航线生成算法中,涉及到超参数距离间隔D,其对航线生成质量有重要影响。生成航线的准确性,取决于对以下条件的满足程度:航线的位置点在不偏离实际线路的基础上覆盖了路线之中必要的控制转向点。为评估航线生成优劣程度,定义误差距离、航线控制点数量两类评估指标。

4.1 误差距离

误差距离用于评价船舶航线和实际航行位置的偏离程度,包括总误差距离和平均误差距离两个指标,计算方式主要与航迹点误差有关。航迹点误差指船舶实际航行轨迹中的位置与船舶航线的最短距离。在计算航迹点误差时,首先将位置经纬度转换为三维空间中的点坐标,计算航迹点在航线上的投影;然后,将投影点坐标转换为经纬度;最后,计算该航迹点与投影点的距离,即为航迹点误差。

总误差距离为对应指定航线的所有实际航行轨迹的航迹点误差之和。平均误差距离计算方式则为:总误差距离/航迹点数量。误差距离越小,说明生成的航线与实际航线的匹配程度越高,反之,则说明航线匹配程度越低。

4.2 航线控制点数量

航线控制点数量指计算得到的航线中所包含的位置点数量,在一定程度上反映了航线的平滑程度。

距离间隔D与位置点数量呈现反比关系,距离间隔D越小,位置点数量越多,航线会出现小范围内过拟合情况,航线呈现锯齿状;距离间隔D越大,位置点数量越少,航线会出现欠拟合情况,航线与部分实际航行位置出现偏差。

5 实验与分析

以某艘船舶为对象,针对以上方法开展实验,选择该船舶连续半年时间内全部位置数据,共74898条。经过分析,某条航线上的数据共35210条,完整航行数据140条,位置轨迹标示情况如图2所示。选择其中一条,共234个位置点,位置轨迹如图3所示。

图3 单次航行位置轨迹

通过设定不同距离间隔D,生成的航线评估指标如表6所示。随着D值的增大,航线控制点数量逐渐减小,而平均误差距离在该范围内呈现出先下降、后上升的趋势。

表6 不同距离间隔下结果对比

距离间隔为1.0km、1.8km、5.0km时生成的航线分别如图4、图5、图6所示。距离间隔为1.0km时,航线呈锯齿状,为5.0km时,航线部分偏离轨迹范围,为1.8km时,航线基本位于位置轨迹中心,较好地代表了船舶行驶路线。

图4 距离间隔为1.0km时航线

图5 距离间隔为1.8km时航线

图6 距离间隔为5.0km时航线

6 结语

针对船舶航线获取问题,提出基于AIS数据的船舶航线生成算法及评估指标,能够从海量船舶航行位置数据中识别和提取船舶航线,并根据平均误差距离和航线控制点数量指标评价航线优劣,为开展船舶位置预测及预警、区域航线规划等分析提供了基础。

猜你喜欢
航迹航行控制点
到慧骃国的航行
梦的航迹
自适应引导长度的无人机航迹跟踪方法
NFFD控制点分布对气动外形优化的影响
小舟在河上航行
航行
基于风险管理下的项目建设内部控制点思考
视觉导航下基于H2/H∞的航迹跟踪
相似材料模型中控制点像点坐标定位研究
SDCORS在基础地理信息控制点补测中的应用