测量数据的合理性检验程序设计

2017-09-08 17:14陈文金
数字技术与应用 2017年6期
关键词:C语言统计学

陈文金

摘要:随着对测量技术的广泛应用,对测量結果的准确度也有更加严格的要求。电子技术的应用为测量技术的科学化、高精度提供了广阔的空间。本课题是根据测量误差理论以及统计学原来,依据莱特判据,即:,用C语音编程程序实现了对几次等精度测量数据的自动处理,剔除不符合莱特判断句条件的异常数据,并得到一系列正确的测量数据以及均值和方差值。

关键词:测量检测;误差理论;统计学;莱特判据;C语言

中图分类号:TP311.11 文献标识码:A 文章编号:1007-9416(2017)06-0194-04

1 目地及意义

运用现代计算机技术,根据测量误差理论和统计学原理,来完成一批数据(等精度测量)的自动分析和处理,为实现高准确度测量提供了可能。给工、农业生产及科研提供了更有价值的信息和科学依据。

2 课题的理论基础

依据测量误差的性质和特点,可将它们分为系统误差、随机误差和粗大误差三大类。在相同条件下多次测量同一量时,误差的绝对值和符号保持恒定,或在条件改变时按某种确定规律而改变的误差叫系统误差。系统误差可以采取一定的技术措施加以减弱或清除;在实际相同条件下多次测量同一量时,误差的绝对值和符号以不可预定的方式变化的误差称为随机误差。随机误差具有:有界性,对称性,抵偿性三个特点。根据随机误差的几个特性。在测量的过程中,加大测试次数即可消除或减少随机误差对测量结果的影响。对超出规定条件下预期的误差我们叫粗大误差[1]。

根据数据统计的有关原理和大量测量实践证明,很多测量结果的随机误差的分布形式接近于正态分布。测量数据的正态分布实际上就是中心极限定理在误差分析中的应用,也叫高斯(Gauss)分布。当测量数据由于随机误差的影响呈正态分布时,测量值对称的分布在被测量的数学期望两侧,即绝对值小的,随机误差出现的概率大,而绝对值大的,随机误差出现的概率小,测量数据的分散程度可用标准偏差来表示。绝对值很大的随机误差出现的概率趋近于零,因此测量值有一个实际界限[2]。

我们在实际测量过程中对被测量不可能进行无线多次测量。因此在实际应用中根据有限次测量数据来估计数学期望值及标准偏差值。

2.1 n次测量的技术平均值

当被测量总体原来就是正态分布时,平均值的分布就是一个分散程度更小的正太分布如图1所示;若被测量总体不是正态分布,那么随着样本容量的加大,样本平均值的分布逐渐变形而趋近于一个正太分布。

2.2 估计有限次测量的标准偏差方法——贝塞尔(Bessel)公式

2.3 测量结果的置信区间和置信概率

由于随机误差的影响,测量值一般来说均偏离被测量的数学期望,而偏离的大小和方向完全是随机的。虽然不能确切的知道尚未进行的某一次测量的结果,但是我们希望知道测量结果在数学期望附近某一确定范围内的可能性有多大。这个确定范围通常用标准偏差的若干倍来表示,即我们希望知道尚未测得的数据x可能处于区间[M(x)-cσ(x)],[M(x)+cσ(x)]内的的概率有多大,这个置信区间我们可以用与cσ(x)进行比较确定,若≤cσ(x),我们称第i次测量的结果xi是在可信区间[M(x)-cσ(x)],[M(x)+cσ(x)]之内如图2所示,数据也是有效数据。若>cσ(x)说明第i次测量的结果xi落在可信区间之外,是个异常数据,剔除不用。

在实际测量中常用算术平均值代替真值,用标准偏差估计值代替标准偏差,凡测量值x_i在区间[M(x)-cσ(x)],[M(x)+cσ(x)]以外的即:>cσ(x)时,就将数据x_i剔除不用。

一个可疑数据是否被剔除,与我们给定的置信概率大小或者说对应的系数c的大小有关。若规定的置信概率过小,使阴影部分的正常值被当作异常数据不能被检查出来。在测量数据为正态分布的情况下,如果测量次数足够多,通常取c=3,作为判别异常数据的界限,称为莱特准则。使用莱特准则在分析和处理测量数据时,简单、方便、准确,因此广泛应用[3]。

3 总体设计思想

根据莱特判断句:>3σ(x),用c语言设计一个程序,程序总体设计思想是:

3.1 步骤

(1)求平均值;(2)求标准偏差估计值;(3)求残差的最大值;(4)用最大值与3σ(x)进行比较:>3σ(x);(5)条件成立,打印异常值的位号和异常值;(6)把异常值剔除后,再把后面的数依次前移,再进行上面1)~5)的步骤,直至>3σ(x)条件不成立,打印正常数值。

3.2 程序流程图

3.2.1 主程序

主程序图3所示。

3.2.2 移位shift子程序

移位shift子程序图4所示。

3.2.3 标准偏差估计值子程序:sigma函数

标准偏差估计值子程序:sigma函数图5所示。

3.2.4 求平均值子程序(AVG函数)

求平均值子程序(avg函数)图6所示。

4 技术实现(程序)

4.1 主程序

利用莱特判断句分析处理测试结果有一定的局限性,即对样本容量较小时,可能会出现失误,例如样本容量n10,莱特准则永远得不到满足,准则失去判断力。我们在使用莱特判据分析处理测试结果时尽量选用较大的样本容量。

参考文献

[1]张世箕.测量误差及数据处理[M].科学出版社,1979.

[2]蒋换文,孙续.电子测量[M].中国计量出版社,1997.

[3]谭浩强.c程序设计[M].清华大学出版社,1997.endprint

猜你喜欢
C语言统计学
关于投稿的统计学要求
统计学符号使用的说明
统计学符号使用的说明
统计学符号使用的说明
本刊对来稿中统计学处理的有关要求
基于Visual Studio Code的C语言程序设计实践教学探索
本刊对来稿中统计学处理的有关要求
基于C语言的计算机软件编程
C语言程序设计课程教学与学科专业相结合的探索
高职高专院校C语言程序设计教学改革探索