计量检测中异常数据剔除的有效方法

2016-03-10 00:16通辽市产品质量计量检测所王晓东
电子世界 2016年24期
关键词:准确性准则仪器

通辽市产品质量计量检测所 王 莹 刘 佳 王 欣 刘 宇 王晓东

计量检测中异常数据剔除的有效方法

通辽市产品质量计量检测所 王 莹 刘 佳 王 欣 刘 宇 王晓东

对于计量测量这项工作来说,它对数据精确性的要求非常高,当计量测量获得的大量数据被通过以后,需要科学合理的对数据进行整理,从而有效剔除可能出现的异常信息,使数据的有效性和实践性得到不断提升。基于此,本文主要对计量检测中异常数据剔除的有效方法进行了探讨。

计量测试;异常数据;剔除;有效方法

计量测量这项工作对数据准确性的要求非常高,当计量测量获得大量的数据以后,需要对这些数据进行科学处理,发现并剔除其中的数据异常值,使数据的准确性得到不断提升,进而使相关活动可以获得科学、合理的参考信息。因此,下面将对计量测量中异常数据出现的各种原因进行分析,获得四种剔除异常数据的方法,这四种办法各有特点,不仅可以进行针对性使用,还可以综合在一起使用,从而异常数剧被及时发现并剔除。

1 计量测试的作用

在日常的各类生产实践活动中都会涉及到计量测试工作,为了使各种数据的使用需求得到满足,需要重新评估检测仪器的测量结果,通过认真分析评估结果,从而使检测仪器的状态是否达到正常使用的标准进行有效的判定。检测数据具有十分重要的意义,在对各环节半成品和最终成品的所有参数、生产技术的稳定性进行评判的时候,需要以此为主要的参考数据,同时也是提升产品质量和指导技术变革和进步的最为行之有效的办法。要想让人对数据信服,就要对其进行精准的计量,因此,要想对工艺流程进行控制、对产品质量进行评定、对产品质量进行有效改变是不可能得以实现的。

2 分析计量仪器出现误差的原因

从统计学的角度上来说,可疑数据主要是指在一组反复测量的数据里,个别数据与其他组数据存在着比较明显差异。可疑数据的主要特征就是与组内的其他数据有着比较明显的不同,也就是说数据发生了改变,然而这种改变是不是发生在合理的范围之内,有待于进行深层次的分析和研判,从而实现科学、有效的确定。

计量仪器隶属于高精密仪器的范畴,对外界环境的要求非常高,如果外界环境出现了比较大的改变,就会使计量仪器的精准度受到影响,从而使检测仪器的检测结果出现一定范围的误差。造成计量仪器出现误差的原因主要有四点:第一,检测仪器受到外界震动或者是机械冲击;第二,受电磁干扰和电网供电不稳而使得检测仪器正常工作受到影响;第三,检测人员熟练程度不够、工作经验不足、主观测量失误以及工作疏忽导致的检测误差;第四,仪器内部电子元件损坏、零件松动等本身故障导致的检测误差。

异常值与合理值之间存在着很大的偏差,假如参与到判定过程和计算中,就会给测量结果造成巨大的影响,使人们的正确决策受到影响。所以一定要将异常值剔除掉,然而使用的剔除办法不正确,就会给异常值消除造成严重的影响,易于导致测量重复性较好的假象出现,给数据真实性的判定带来了严重的阻碍,使人们提升检测仪器的等级被严重误导。假如不剔除异常值,就会使测量数据的重复性被降低,使检测仪器的等级受到了严重的影响。综上所述,只有使用正确的剔除方法,才能使最后的测量结果满足人们的使用需求。

3 判定异常值的标准

在对实践活动进行计量的时候,经常使用的异常值判定准则有四种:第一,3Σ准则;第二,t 检验法;第三,肖维勒准则;第四,格拉布斯准则。上述的几种准则存在着一定的差别,在实际判断的时候,置信概率会被使用到。置信概率主要是指“置信区间”高于随机变量的概率,使用X来表示置信区间测量数据取值范围,其表达式如下:

(1)3Σ准则:

把测量的数据带入到表达式中,与判定值相一致,可以将该测量结果判定为异常值,需要将其进行剔除。

(2)t 检验法

数据集合总体是指检验方法为可疑数值 xi外的数值,将该数据集假设成一种正态分布模式,把可疑数值 xi当做成样本容量特殊总量,用1来表示。经过对两个总体进行认真比较,其结果显示它们隶属于相同的总体,得出的最终结论为,二者之间没有比较明显的不同,因此其统计量计算公式为:

(3)肖维勒准则:

4 分析案例

通过对真实案例进行认真仔细的分析,从而使异常值判定更加的科学、合理。例如,在对某组数据进行精度测量以后,得出的数据值分别为10.347、10.343、10.321、10.313、10.231、10.229、10.221、10.219、10.205和10.003。使用上述的异常值判定法来进行判定,从而使判定操作具有较强的针对性,最终得出的结论都是一样的,异常值的最终判定值为10.346。其中,10.003-10. 347与比较接近,这也充分的体现出,在这样的情况里使用格拉布斯准则对异常值进行判定的效果非常好,其准确性也比较高。通过对这一案例的仔细判定,可以使异常值判定的思想得到较好的体现。首先设定好一个统计量,假如该统计量正好处于规定的范围之内,则说明这个统计量与正态分布比较吻合。反之,则表明统计量与正态分布不相吻合,说明该数据值中有误差存在。要想使异常值被准确、快速的判断出来,可以将数据按照从大到小的顺序进行排列,先对最小值和最大值进行怀疑,假如这两个极值不是异常值,那么其他的数值也不会成为异常值。在上面的四种判定准则里,3Σ准则是需要进行查表的,其他的三种准则不需要进行查表,把计算值和参考值进行认真比较,分析3Σ准则,从公式的角度来看,如果测量次数N比较大,它所对应的标准差σ就会比较小,此时3Σ准则就会非常精准。通过使用贝塞尔公式得出的标准差σ需要在公式中进行反复测量,测量次数N的最小值为10,假如测量的次数在50以上,那么使用3Σ准则就会在最短的时间之内将异常值测量出来。通过使用狄克逊准则计算公式可以发现,使用该准则可以将多个异常值在一次测量中被全部剔除,因此在对多个异常值进行判定的时候,可以使用该准则进行快速判定,从而使异常值判定的速度得到不断加快,使其准确性得到较好保障。

5 结语

综上所述,在进行实际测量的时候,可以综合使用上述的四种办法,从而使测量的准确性得到不断提高,使误判的现象得到有效控制。假如结论都是一样的,将异常值剔除以后,会使测量的准确性得到较大程度的提高。相反,假如判定的结果不一样,就需要进行认真的分析和思考,使用其他的办法重新进行判定,直到数据信息达到统一的标准为止。

[1]王元明,熊伟.异常数据的检测方法[J].重庆工学院学报(自然科学版),2009(02).

[2]吴展,蔡萍.一种改进的动态过程测量数据预处理方法[J].传感技术学报,2010(04).

[3]徐丹,王中禹.计量测试中异常数据剔除的措施[J].科技经济导刊,2016(20).

猜你喜欢
准确性准则仪器
《现代仪器与医疗》2022年征订回执
《现代仪器与医疗》2022年征订回执
浅谈如何提高建筑安装工程预算的准确性
理解语境与名句的关系,提高默写的准确性
具非线性中立项的二阶延迟微分方程的Philos型准则
我国古代的天文仪器
为桥梁领域的示值准确性护航
基于Canny振荡抑制准则的改进匹配滤波器
影响紫外在线监测系统准确性因子分析
学学准则