基于两种转换的非正态过程能力研究的比较

2011-10-18 10:32杨洁荣宋向东明喆胡蓓蓓王树力
统计与决策 2011年6期
关键词:正态位数正态分布

杨洁荣,宋向东,明喆,胡蓓蓓,王树力

(燕山大学理学院,河北秦皇岛066004)

基于两种转换的非正态过程能力研究的比较

杨洁荣,宋向东,明喆,胡蓓蓓,王树力

(燕山大学理学院,河北秦皇岛066004)

文章应用Box-Cox转换和Johnson转换对几种非正态分布进行了研究,并计算出了其过程能力指数,通过大量的重复模拟研究了该方法在过程能力分析中的适用性和效果。结果显示,Johnson转换比Box-Cox转换更有效。文章用相应的matlab分析软件来辅助实现这个方法,具有可操作性,可以用于指导生产实践。

非正态;过程能力指数;Box-Cox转换;Johnson转换

0 引言

在许多统计过程控制(SPC)技术的应用中,要求所关心的质量特性服从正态分布。然而,实际中存在大量不符合正态假设的质量特性。此时若应用正态假设下的SPC技术,则会增加第1类风险。研究表明:正态性的明显偏离会严重影响与控制图相关的平均运行长度。解决该问题的方法是:一是找到这种质量特性本身的分布函数,则可通过函数间的转换将非正态数据转换为正态数据,即基于非正态分布的过程能力指数的计算方法;二是将非正态数据转换为“正态分布”的数据,然后用传统方法计算过程能力指数[1]。

1 主要用到的方法

1.1 Box和Cox提出的幂转换方法[2]

设X表示的是质量特性,则

这里要求变量取值为正,如果数据有负,可同时增加一个常数使其为正值。λ的估计值采用极大似然估计法。

1.2 Johnson分布曲线族[3]

针对一个具体的非正态应用场合,如何根据样本选择合适的Johnson曲线类型是首要的问题,其步骤如下:

选择一个合适的z,通过标准正态表找出对应于{-SZ,-Z, Z,SZ}的分布概率p-sz、p-z、pz、psz。在样本数据中找出对应的分位数x-sz、x-z、xz、x3z,并令m=xsz-xz,n=x-z-x-sz,p=xz-x-z定义分位数比率QR=mn/p2。Bowman和Shenton根据QR提供了选择SB、 SU的一般规则:如果则选择SB;如果,s≥,则选择SU。

结果发现,只有在s=3时才能找到区分SB、SL和SU的规则:

当QR<1时,选择SB分布;当QR=1时,选择SL分布,当QR>1时,选择SU分布。

而在s=3的情况下,只有确定合适的z值,就可以确定需要拟合数据的Johnson系统。在转换后的数据基础上,就可以应用正态假设下的质量控制技术了。

接下来讨论以下三种转换类型的具体参数的确定方法:

(1)对于SB曲线:

(2)对于SU曲线:

表1 Johnson分布系统

一旦求得Johnson曲线的位置参数和标准参数(ε,γ,λ,η),便可以求得概率为0.5,0.0135和0.99865所对应的百分位数x0.5,x0.00135和x0.99865[4]。从而可以求出相应的过程能力指数。

2 主要的研究过程及结果

2.1 运用两种转换比较分析

(1)生成一组服从自由度为10和20的分布的随机数(100行1列),求得其0.00135分位数为0.1188,0.99865分位数为4.0931,将其分别作为公差下限和公差上限,即其USL=4.0931,LSL=0.1188。

转换前:其过程能力指数为0.9019,通过Lilliefors正态性检验,求得检验统计量为0.1234,临界值为0.0890,其检验的p值为0.0010,可判断它不服从正态分布。

Box-Cox转换后:

其过程能力指数为0.8838,通过Lilliefors正态性检验,求得检验统计量为0.0520,临界值为0.0890,其检验的p值为0.5000,可判断它服从正态分布。

Johnson转换后:

其过程能力指数为0.7482,通过Lilliefors正态性检验,求得检验统计量为0.0502,临界值为0.0890,其检验的p值为0.5000,可判断它服从正态分布。

(2)生成参数为a=1.5和b=2的Γ分布的随机数(100行1列),求得其0.00135分位数为0.1084,0.99865分位数为10.9457,将其分别作为公差下限和公差上限,即USL= 10.9457,LSL=0.1084。

转换前:其过程能力指数为0.8776,通过Lilliefors正态性检验,求得检验统计量为0.1131,临界值为0.0890,其检验的p值为0.0031,可判断它不服从正态分布。

Box-Cox转换后:

其过程能力指数为0.7973,通过Lilliefors正态性检验,求得检验统计量为0.0469,临界值为0.0890,其检验的p值为0.5000,可判断它服从正态分布。

Johnson转换后:

其过程能力指数为0.7864,通过Lilliefors正态性检验,求得检验统计量为0.0429,临界值为0.0890,其检验的p值为0.5000,可判断它服从正态分布。

(3)生成自由度为5的χ2分布的随机数(100行1列)求得其0.00135分位数为0.4737,0.99865分位数为13.9823,将其分别作为公差下限和公差上限,即USL=13.9823,LSL= 0.4737。

转换前:其过程能力指数为0.7223,通过Lilliefors正态性检验,求得检验统计量为0.1513,临界值为0.0890,其检验的p值为0.0010,可判断它不服从正态分布。

Box-Cox转换后:

其过程能力指数为0.7444,通过Lilliefors正态性检验,求得检验统计量为0.0614,临界值为0.0890,其检验的p值为0.4628,可判断它服从正态分布。

Johnson转换后:

其过程能力指数为0.7202,通过Lilliefors正态性检验,求得检验统计量为0.0564,临界值为0.0890,检验的p值为0.5000,可判断它服从正态分布。

(4)生成参数为a=0.5和b=0.6的β分布的随机数(100行1列)求得其0.00135分位数为0.0001,0.99865分位数为0.9999,将其分别作为公差下限和公差上限,即USL=0.9999,LSL=0.0001。

转换前:其过程能力指数为0.4857,通过Lilliefors正态性检验,求得检验统计量为0.1602,临界值为0.0890,其检验的p值为0.0010,可判断它不服从正态分布。

Box-Cox转换后:

其过程能力指数为0.5659,通过Lilliefors正态性检验,求得检验统计量为0.0948,临界值为0.0890,检验的p值为0.0275,可判断它不服从正态分布。

Johnson转换后:

其过程能力指数为0.5937,通过Lilliefors正态性检验,求得检验统计量为0.0611,临界值为0.0890,检验的p值为0.4714,可判断它服从正态分布。

从上面的四种分布的各自随机模拟的100个数据来看,两种转换基本都能实现正态转换,但转换效果不明显。

2.2 基于随机模拟的转换效果评价

下面我们通过多数据大量重复试验:每次产生1000个随机数,重复模拟1000次,比较两种转换的过程能力指数Cp的平均值,更接近于1的转换效果较好。

(1)F分布

通过Box-Cox转换对应的Cp的平均值为1.0287,Johnson转换对应的的平均值为1.0244,可见对于F分布,Johnson转换较好。

(2)Γ分布

通过Box-Cox转换对应的Cp的平均值为0.9489,Johnson转换对应的的平均值为1.0040,可见对于F分布,也是Johnson转换较好。

(3)χ2分布

通过Box-Cox转换对应的Cp的平均值为0.9712,Johnson转换对应的的平均值1.0150,可见对于χ2分布,也是Johnson转换较好。

(4)β分布

对于β分布,通过两种转换对应的Cp的平均值都比较小,分别为0.5551和0.6743,与理论值1的差距较大,说明将两种转换用于β分布是不合适的。

综上评价,认为Johnson转换效果好。

[1]Kotz S,Johnson N L.Process Capability Indices-a Review,1992-2002[J].Journal of Quality Technology,2002,34(1).

[2]Yang Jian-feng.Liu Yumin.Jin-feng.Yang Jianfeng.Liu Yumin. He Jinfeng.Based Box-Cox Power Transformation of Non-Normal Process Capability Analysis[J].Engineering,2006,24(8).

[3]Zhou Qun Yan.Conversion System Based on Johnson's Non-Normal Process Capability Index Estimates[J].Engineering,2004,22(5).

[4]Kong Xiangfen,He Zhen.Non-Normal Process Capability Analysis and Control Method[J].Dissertation,2007,5.

[5]Chou,C.Y,Chen,C.H.,Liu,H.R.Economic—statisticalDesignof X-bar Charts for Non-normal Data by Considering Quality Loss [J].Journal of the Applied Statistics,2000,27.

[6]Chou,C.Y,Chen,C.H.,Liu,H.R.Effect of Non-normality on the Economic Design of Warning Limit X—barcharts[J].Quality Engineering,2004,16(4).

[7]Clements,J A.Process Capability Calculationsfor Nono-normal Distributions[J].Quality Progress,1989,(22).

[8]Tang Shuming,Fei-Yue Wang.Process Capability Indices[J].Application of Probability and Statistics,2004,(2).

[9]Zhang Gongxu Editor.Modern Quality Management[M].Beijing: China Financial and Economic Publishing House,1999.

(责任编辑/易永生)

F273.2

A

1002-6487(2011)06-0165-02

杨洁荣(1984-),山西临汾人,硕士研究生,研究方向:质量控制理论。

猜你喜欢
正态位数正态分布
关于n维正态分布线性函数服从正态分布的证明*
五次完全幂的少位数三进制展开
连续自然数及其乘积的位数分析
利用二元对数正态丰度模型预测铀资源总量
偏对称正态分布的若干性质
双幂变换下正态线性回归模型参数的假设检验
正态分布及其应用
关于二维正态分布的一个教学注记
基于泛正态阻抗云的谐波发射水平估计
基于直觉正态云模型和最优变权的变压器绝缘状态评估