加权整体最小二乘算法在直线拟合中的应用

2017-09-14 22:29曹泽强朱笑笑
魅力中国 2017年27期

曹泽强++朱笑笑

摘要:在日常测绘生产实践中,常会遇到不等精度直线拟合的问题,利用加权整体最小二乘算法可以有效解决此类问题。首先对待解决问题借助EIV模型建立误差方程,然后采用Newton-Gauss法进行迭代计算,将所得结果与最小二乘算法,整体最小二乘算法进行横向精度分析。经实例计算可知,加权整体最小二乘算法拟合效果更好,拟合精度更高。

关键词:加权整体最小二乘;EIV模型;直线拟合;Newton-Gauss法

Application of Weighted Integral Least Squares in Straight Line Fitting

CAO Ze-qiang, ZHU Xiao-xiao

(School of Geography and Urban Planning, Jiangsu Normal University, Xuzhou 221000)

Abstract: In the practice of daily surveying and mapping production, the problem of straight line fitting is often encountered. The weighted average squares algorithm can solve this problem effectively. Firstly, the error equation is established by means of EIV model. Then, the Newton-Gauss method is used to calculate the iteration. Finally, the result is compared with the least squares algorithm and the whole least squares algorithm. The results show that the weighted average squares algorithm is better and the fitting precision is higher.

Key words: weighted global least squares; EIV model; straight line fitting; Newton-Gauss method

一、引言

直线拟合在工程测量、变形监测、桥梁建筑、房屋建造等测量工作中都有广泛应用[1]。一般拟合方法是测定直线上若干个点,假设自变量没有误差,然后依据最小二乘原则建立误差方程。而实际情况下,自变量也是有误差的,因此常规拟合方程中存在着一定的模型误差[2]。若要减小这些误差,可以利用整体最小二乘算法(Total Least Squares,TLS)来兼顾系数矩阵和观测量的误差以求得更为精确的拟合参数[3]。该算法起源于20世纪90年代,一经提出便引起了很多学者的关注[4]。随着对该算法的深入研究,学者们发现当系数矩阵,观测向量为不等精度观测时,如果直接采用TLS算法进行参数估计则可能会出现解失真的情况[5],因此需要引入协因数阵[6]的计算,即引入加权整体最小二乘算法(Weighted Total Least Squares,WTLS)。分别对观测点的和坐标分量赋予相应权重[7],以求得更为准确的拟合结果。

二、直线拟合

设某条未知直线的方程表达式为:

(1)

(1)式中和分别为对应误差和的估计值。若有个观测值,则存在个观测方程,这些方程用矩阵可表述为:

(2)

(2)式中各元素表達式如下:

(3)

三、直线拟合算法模型

(一)TLS算法模型。

(4)

从式(4)中可以看出TLS算法默认系数矩阵和观测向量均是等精度观测,从而不考虑其权阵。而在现实情况中,因为模型误差、测量员操作误差、仪器误差等使得观测向量和系数矩阵多为不等精度观测[8],从而需要为观测向量和系数矩阵赋予相应的权重,利用WTLS算法来解决此类直线拟合问题。

(二)WTLS算法模型。

(5)

在式(5)中,,表示系数矩阵的偶然误差矩阵,表示将按列拉伸向量化。和分别代表系数矩阵的列向量协因数阵和行向量协因数阵,且,,为阶方阵,为阶方阵。在TLS算法中,和皆为单位阵;而WTLS算法分别赋予观测向量和系数矩阵以不同的权重,因此WTLS算法的拟合模型为:

(6)

由于EIV模型是一种非线性模型,因此使用Shen[9]提出的基于Newton-Gauss法[10]的WTLS迭代算法。

对直线误差方程进行第次迭代计算后的结果为:

(7)

在(7)式中,表示的改正值,表示第次迭代计算所得系数矩阵的改正值。

借助(7)式构造拉格朗日极值函数[11]:

(8)

对(8)式求偏导并消去得第次迭代计算所得参数近似值为:

(9)

(9)式中各元素表达式如下:

(10)

综上可得基于Newton-Gauss法的WTLS迭代算法计算步骤为:

令 ,计算初始值[12]:

(11)

迭代过程从到,当(为给定阈值)时,迭代终止。

(三)实例分析。

模拟直线,设计直线模型为。自变量范围为、因变量范围为,利用软件随机生成10个点,并为每个点的坐标和坐标分别添加随机误差,然后用LS,TLS,WTLS三种算法进行直线拟合。endprint

表1樣本数据

i xi Pxi yi Pyi

1 2.1582 1000 -7.9493 1.0

2 -2.2177 1000 18.3062 1.8

3 2.8303 500 -11.9818 4.0

4 4.2313 800 -20.3877 8.0

5 3.1582 200 -13.9490 20.0

6 1.2323 80 -2.3936 20.0

7 0.8249 60 0.0505 70.0

8 -0.1160 20 5.6957 70.0

9 -3.8206 1.8 27.9238 100.0

10 -5.0360 1.0 35.2160 500.0

拟合结果如表2:

表2拟合结果

估计量 真值 LS TLS WTLS

斜率 -6.0000 -6.0033 -6.0005 -5.9998

截距 5.0000 5.0411 5.0057 5.0025

精度分析如表3:

表3精度分析

计算算法 平均偏差 平均偏差

LS 0.0019 0.0359

TLS 0.0005 0.0053

WTLS 0.0002 0.0037

由表3可知,最小二乘算法(LS)所得参数估值与真值平均偏差最大。由于整体最小二乘算法(TLS)兼顾了系数矩阵和观测向量的误差,其解算结果优于LS,平均偏差较LS算法降低了71.87%和85.19%。又因为加权整体最小二乘算法(WTLS)加入了协因数阵的计算,因此拟合效果最好,其平均偏差较LS算法降低了88.54%和89.70%,较TLS算法降低了62.96%和30.45%。

四条拟合直线图如图1:

图1拟合直线图

实验结果表明:TLS算法兼顾系数阵和观测向量的误差,拟合结果相较LS算法与实际情况更加吻合;而在不等权观测情况下,WTLS算法引入了协因数阵的计算,因此所得参数估值与真值平均偏差最小,其直线拟合效果明显优于LS和TLS算法。

四、结论

WTLS算法在处理不等精度观测的直线拟合问题时有明显的优势,其相较于LS和TLS算法,可以得到精度更高、更稳定的拟合结果。但是现行WTLS算法多涉及大量公式,计算过程仍较为繁琐,不利于测量工作者们的快捷使用。因此在未来的测量数据处理中,如何结合实际测量数据特点、判断系数矩阵误差、观测向量误差对参数求解的影响程度,以及如何更好的优化WTLS算法等都是值得进一步研究的问题。

参考文献:

[1]姚宜斌, 黄书华, 孔建,等. 空间直线拟合的整体最小二乘算法[J]. 武汉大学学报信息科学版, 2014, 39(5):571-574.

[2]卢艳, 韩建民, 陶建平. 基于非线性半参数模型的城市群似大地水准面系统误差研究[J]. 现代测绘, 2013, 36(1):7-8.

[3]丁克良, 欧吉坤, 陈义. 整体最小二乘法及其在测量数据处理中的应用[C]// 中国测绘学会第九次全国会员代表大会. 2009.

[4]王继刚, 周立, 蒋廷臣,等. 一种简单的加权整体最小二乘直线拟合算法[J]. 测绘通报, 2014(4):33-35.

[5]陶叶青, 高井祥, 姚一飞. 平面坐标转换的稳健整体最小二乘算法[J]. 中国矿业大学学报, 2014, 43(3).

[6]杨雪峰, 龚涛, 汪精河. 测量平差中求解协因数的简化算法[J]. 测绘科学, 2009, 34(1):85-86.

[7]张清波, 潘九宝. 总体最小二乘的加权GPS高程曲面拟合法[J]. 现代测绘, 2014, 37(5):54-56.

[8]董校洪. 整体最小二乘法在工程测量上的应用[D]. 同济大学, 2009.

[9]Shen Y, Li B, Chen Y. An iterative solution of weighted total least-squares adjustment. J Geod[J]. Journal of Geodesy, 2010, 85(4):229-238.

[10]Li X, Esser E, Herrmann F J. Modified Gauss-Newton full-waveform inversion explained — Why sparsity-promoting updates do matter[J]. Geophysics, 2016, 81(3):R99-R112.

[11]展丙军. 关于拉格朗日乘数法的一点注记[J]. 高等数学研究, 2010, 13(2):51-52.

[12]Schaffrin B, Wieser A. On weighted total least-squares adjustment for linear regression[J]. Journal of Geodesy, 2008, 82(7):415

作者简介:

第一作者,曹泽强(1996.06-),男,汉族,江苏徐州,测绘工程。

第二作者,朱笑笑(1995.10-),女,汉族,江苏连云港,遥感科学与技术。

注:江苏省自然科学基金青年项目(BK20150236);江苏师范大学自然科学研究基金(15XLR019)endprint