GPS基线解算结果的Bayes判别分析

2018-12-03 06:59郝美云孙宪坤丁倩云尹京苑
导航定位学报 2018年4期
关键词:基线分类器观测

郝美云,孙宪坤,尹 玲,丁倩云,尹京苑

(1.上海工程技术大学 电子电气工程学院,上海 201600;2.上海市地震局,上海 200333)

0 引言

高精度控制网(如国家A、B级网)的建立以及各种形式的形变检测(如地壳运动、桥梁建筑物、海平面变化等)都离不开高精度全球定位系统(global positioning system,GPS)控制网基线解算过程,解算完成后需要对其解算质量进行分析。其中归一化均方根(normalized root-mean-square value,NRMS)是衡量基线解算质量的重要指标之一,一般为0.25左右最优,理论上应小于0.3[1]。当出现NRMS值偏大或解算中途失败的情况时,一般要人为查找错误原因,改正后再重新进行基线解算。针对数据量大,基线较长的大网,重复进行解算将耗费很长时间。在影响解算结果的诸多因素中,控制参数在解算时会多次变动,成为影响解算结果的重要不确定因素。

目前,对于解算控制参数的研究已有不少学者进行过相关工作。如文献[1]分析了截止高度角、天顶延迟参数、观测值类型等参数对解算结果的影响,提出一般解算情况下选择10°的截止高度角比较适宜,天顶延迟参数取13,即每2 h产生一个天顶延迟估值比较合适。而观测值类型则根据不同情况设置,对精度影响较大;文献[2]研究了双频观测中的L1解(L1_ONLY)、双频观测中L1、L2独立组合解(L1L2_INDEPENDENT)、基于电离层约束求解宽巷模糊度的LC解(LC_HELP)和基于码求解宽巷模糊度的LC解(LC_AUTCLN)这4种观测值类型对解算结果的影响,指出4种类型的设置对解算结果精度具有较大影响;文献[3]研究了起始点坐标偏差对基线解算结果的影响,在进行基线解算时必须选取高精度的起算点。文献[4-5]研究了Niell映射函数(Niell mapping function,NMF)、Vienna 映射函数(Vienna mapping function 1,VMF1)和全球映射函数(global mapping function,GMF)在不同高度角时对GPS解算结果的影响,选择合适的映射函数对于对流层模型的准确性和 GPS 定位精度的提高有着十分重要的意义,指出采用 10°的高度角比较适宜。这些研究工作都具有一定的指导意义,但都是通过特定的数据针对不同控制参数来研究其对解算结果精度的影响。本文希望融合这些影响较大的控制参数,建立一个Bayes分类模型来预测基线解算结果的好坏,提高解算效率。基于以上分析,考虑到对流层映射函数模型、卫星高度角、先验坐标和观测值类型在解算过程中变动频繁且对解算结果影响较大[6],选取以上4个参数作为解算结果的判别因子并建立Bayes预测模型。

1 Bayes分类器

要想实现解算结果的预测,需要选择一个合适的分类器。这是一个有监督学习过程的分类问题,此类问题的算法有很多。但是考虑到选取的4类参数之间是相互独立的,即4类参数在设置更改的时候不存在依赖关系,所以选用Bayes分类器比其他判别模型如逻辑回归要快很多;另外训练集不大,选择Bayes分类器比选择K-近邻分类器更不容易造成过拟合现象[7]。基于此,引用Bayes分类器来实现解算结果的预测分类,其分类原理如下:

设x={a1,a2,…,am}为一个待分类项,其中a1是待分类项x的一个特征属性。对应于本文,x可以理解为GPS基线解算结果项,这个结果项是由4类特征属性决定的。类别集合表示成C={y1,y2,…,yn},C对应于本文中GPS解算结果的类型集合,normal或者abnormal。在x的各个特征属性独立的情况下,根据Bayes定理,样本属于类别yi的概率可以表示为

(1)

式中:p(yi|x)表示在已知待分类项x的特征属性的情况下求样本x属于类别yi的概率;p(x|yi)表示在样本空间中已知样本属于类别yi的情况下求yi对应的x的各组特征属性的概率;p(yi)表示样本空间中各个类别的样本所占的比例;p(x)表示各个类对应的特征属性的概率之和,p(x)=p(x|y1)p(y1)+p(x|y2)p(y2)+…p(x|yn)p(yn)。对于一个待分类项,在已知特征属性的条件下求属于各个类的概率,概率最大值对应的类别就是分类器输出的结果。对于式(1)可以做如下简化,分母p(x)对于所有的类别来说是一个常量,所以要想p(yi|x)值最大,只需考虑将分子最大化即可。又因为各特征之间相互独立,所以分子可以表示为

(2)

式中:p(aj|yi)表示在已知类别yi的情况下各个特征属性的概率;其余变量的意义见式(1)。所以只需得到式(2)的最大值,分类器就能输出待分类样本x所属的类别yi。

2 GAMIT基线解算结果预测的Bayes判别模型

利用Bayes分类器建立GAMIT基线解算结果的预测模型首先需要在GAMIT解算过程中设置更改4类参数来获取不同的样本数据,从而获得基线解算结果的先验概率。然后利用训练样本进行Bayes预测模型训练获得基线解算结果属于某类的后验概率,最后利用测试集检验预测模型的性能。

2.1 数据处理策略及质量校核

对流层映射函数模型、卫星高度角、观测值类型这3个参数可以在测段信息控制文件sestbl.中做不同的更改;先验坐标参数在lfile.rnx文件中更改可以获取不同数值。在利用 GAMIT解算过程中除了更改实验所需变动的控制参数,其他控制参数默认设置如下:采用RELAX解算处理模式[8],观测值模型选用LC_AUTCLN,天顶延迟参数个数为13,卫星高度角为10°;采样间隔30 s,观测时长24 h,采用萨斯塔莫宁模型,GMF映射函数,J2000惯性系,ITRF08框架。

解算结果在Ubuntu16.04系统,GAMIT10.6环境下采集得到。采用上海崇明站DCMD,2015年03月21日(年积日第80天)至2015年03月31日(年积日第90天)11 d的数据。按照公共站的选取原则[9]选取BJFS、CCJ2、LHAZ、PIMO、YSSK这5个公共站,采用采用IGS精密星历进行解算精密星历进行解算。为了排除由于不好的观测数据而导致解算结果出现abnormal现象,文中用到的原始观测数据均使用TEQC和RTKLIB软件进行质量检核,对于不好的观测数据都已剔除弃用。数据质量标准如下:L1多路径(L1 multipath,mp1)、L2多路径(L2 multipath,mp2)分别为0.32、0.33,观测数据与周跳比为24 882,利用率100 %;其卫星可见性、几何精度因子(dilution of precision,DOP)值,多路径及卫星高度角分别如图1~图3所示。可以看到DCMD测站卫星可见性良好,DOP值较小,多路径效应不明显[10],即观测数据质量较好。

2.2 实验设计与采集结果分析

实验分别采用0、10°、15°、25°、30°、35°、40°卫星高度角和NMF、VMF1 和 GMF三种映射函数进行组合解算,实验结果如表1所示。当卫星高度角设置为0、10°、15°、25°、30°时,无论采用哪种映射函数,解算结果的NRMS值都小于0.3。随着卫星高度角的增大,NMF映射函数下NRMS值逐渐优于GMF和VMF1下的NRMS值。VMF1更适合在卫星高度角较小的情况下使用,卫星高度角在10~15°时,GMF和VMF映射函数的改正效果相差不大[11]。分析其在N、E、U3个方向的误差,NMF 映射函数在N、E、U3个方向误差均要明显大于GMF和VMF1,VMF1的效果要略好于GMF,因此推荐优先使用VMF1映射函数或GMF函数[4]。当卫星高度角大于等于35°之后,无论采用哪种映射函数,解算结果出现NRMS值偏大或解算失败的情况,属于abnormal类。这种情况是由于卫星高度角过高而导致解算过程中可用数据过少造成的[12]。

表1 映射函数模型和卫星高度角的采集结果

实验中对测站的先验坐标X、Y、Z方向分别加入10、30、50、100、300 m的误差,将各测站坐标施加强约束(X=0.05 m,Y=0.05 m,Z=0.05 m)进行GAMIT解算,解算结果如表2所示。当先验坐标的偏差在10、30 m时,解算的NRMS值在正常范围内且X、Y、Z方向坐标差较小,结果为normal类。当先验坐标的偏差在50、100、300 m时,解算结果为abnormal。在坐标偏差为50 m时NRMS值虽然处于正常范围,但是查看基线解算结果的质量指标文件sh_gamit_***.summary发现参数的改正量大于其约束量,这是不符合基线解算结果要求的,所以解算结果为abnormal。另外要想得到1 mm左右的基线解算精度,各测站近似坐标的绝对误差必须小于300 m[13]。

表2 先验坐标参数的采集结果

L1_ONLY、LC_HELP、LC_AUTCLN 和L1L2_INDEPENDENT是GAMIT软件中4种常用的高精度GPS基线解类型[2]。实验中分别采用这4种类型的观测值进行GAMIT解算,实验结果如表3所示。分析表3可知当选用基线解类型LC_HELP、LC_AUTCLN时解算结果为normal,而选用L1_ONLY、L1&L2时解算结果为abnormal。因为L1_ONLY和L1L2_INDEPENDENT仅适用5 km以下基线向量解算,LC_HELP和LC_AUTCLN适合长基线解算[2]。由于短基线两端观测环境相关性极强,宜采用差分模式消除观测误差的L1L2_INDEPENDENT和 L1 _ ONLY 解,而不宜采用模型改正的LC_AUTCLN解[14]。GAMIT软件主要是针对中长基线解算的软件,所以本文的分类器所选特征属性LC_HELP和LC_AUTCLN对应的解算结果是normal类。

表3 观测值类型参数的采集结果

总结以上分析,可以确定每个参数的特征属性划分及标签,最终确定训练样本的特征向量形式如表4所示。由于篇幅限制,表中未将所有参数之间的组合数形式一一列出。

表4 训练样本的数据特征向量表现形式

3 Bayes分类器运用实例结果分析

3.1 实验设计及结果评价指标

在MATLAB R2014a平台上编写算法程序,完成GAMIT基线解算结果预测模型的训练。随机抽取10组样本进行分类预测,识别的准确率见表5。10组样本的预测平均准确率是99.06 %,说明本文提出的Bayes分类算法的高效性。

表5 Bayes分类器的预测模型识别结果

续表5

评价分类器的性能时,不仅要尽可能考虑达到高的准确率,还要考虑误判时会带来什么后果。文中希望分类器能判断基线解算结果的好坏,如果abnormal误判为normal,这远比将normal误判为abnormal带来的后果要严重。基于此,实验统计了normal和abnormal的精确率、召回率以及F1值。采用相同的10组测试样本进行测试,3个指标如表6所示。通过表6可以看到abnormal类的平均召回率高达99.77 %、F1值99.17 %;normal类的平均召回率达94.64 %、F1值97.25 %。abnormal类的召回率高于normal类的召回率,这说明abnormal被预测为正的样本中预测正确的个数比较高,也就是说出现误判时normal类更有可能被分类器预测为abnormal类,这符合我们所希望的。综合这3个指标分析得出:文中提出的基于Bayes分类的GAMIT基线解算结果的预测模型具有非常优秀的判别性能,能够作为基线解算结果的预判模型。

表6 模型性能评价指标平均值 %

3.2 分类器对不同地区原始观测数据样本集的判别

文中用到的解算数据来源于上海崇明2015年3月21日至2015年3月31日共11 d的原始观测数据文件。针对不同地区,文中提出的Bayes判别分类模型是否同样适用的问题,设计实验进行研究分析。选取欧洲(LPAL、RECF)、非洲(WIND、ABPO)、美洲(COYQ、RIO2)及亚洲(ADIS、BJFS)地区各2个IGS站,在linux系统里面用脚本语言sh_get_rinex、sh_get_nav、sh_get_orbits下载8个IGS本地站及各自公共站的观测值文件、广播星历文件和精密星历文件。在解算8个本地站时,对上文提到的4类参数做不同的设置,记录相应的解算结果。用生成的GAMIT基线解算结果Bayes分类器对解算结果进行预测,将预测结果与实际解算出来的结果进行对比分析来统计各自的平均准确率,见图4。

从图4可以看出,GAMIT基线解算结果的Bayes判别模型对不同地区的测站数据解算结果都有超过98.70 %的准确率,该模型具有一定的普适性。

4 结束语

首先,针对GAMIT解算过程中出现的NRMS值偏大、解算失败的情况,选取了4个参数作为判别因子,建立了GAMIT基线解算结果的Bayes预测模型。实验结果表明,提出的模型具有很高的分类准确率(99.06 %)和F1值。

其次,提出的预测模型可以有效地解决重复解算造成的效率低下问题,同时也为初学GAMIT解算软件的非专业数据处理人员提供一个学习平台。即可以输入不同的参数组合,观察解算结果的变化。

最后,将Bayes分类器应用到GAMIT解算结果预测方向,开拓了机器学习的应用范畴。但文中仍存在诸多不足,影响GAMIT软件解算结果的参数远不止文中提到的4类,文中提出的方法具有一定的应用局限性。影响GAMIT解算结果的因素很多,人为查找改正具有一定的局限性和遗漏性,下一步可以考虑利用神经网络或者深度学习实现对影响因素的全面查找及自动改正。

猜你喜欢
基线分类器观测
高度角对GNSS多系统组合短基线RTK影响
学贯中西(6):阐述ML分类器的工作流程
GNSS 静态相对定位精度分析与比较
基于朴素Bayes组合的简易集成分类器①
基于动态分类器集成系统的卷烟感官质量预测方法
新版GAMIT10.70解算GPS/BDS基线精度对比分析
一种自适应子融合集成多分类器方法
基于虚拟基线的相位干涉仪阵列优化设计
天文动手做——观测活动(21) 软件模拟观测星空
2018年18个值得观测的营销趋势