基于非参数统计量的多元控制图研究

2021-09-28 01:42郭佳晟刘以建
组合机床与自动化加工技术 2021年9期
关键词:参数检验失控正态分布

郭佳晟,刘以建

(上海海事大学物流工程学院,上海 201306)

0 引言

统计过程控制(Statistical Process Control, SPC)作为经典质量控制方法,可以有效地提升产品质量,保障生产过程。但其针对于单变量的局限性,对现代复杂工艺生产过程的应用效果不佳,生产过程中,常常存在多个具有相关关系的质量特性和过程参数,例如零件加工的长度和直径、化工过程的温度、压力等。只对单个变量监控而不考虑变量之间的相关性会导致误报警率显著增加,因此需要用多元控制图进行过程监控。Hotelling在1947年首先提出了基于T2统计量的多元控制图,用于对包含多个质量特性的生产过程实施统计监控,由此有了多变量统计控制过程(Multivariate Statistical Process Control, MSPC)的研究。相继有了多元累积和(Multivariate Cumulative Sum, MCUSUM)控制图以及多元指数加权移动平均(Multivariate Exponentially Weighted Moving Average, MEWMA)控制图等。

传统的控制图可以称为参数控制图,即需要对总体分布有简单假定,例如正态分布。但实际所采集到的信息,可能无法对总体分布作出简单的假设,例如单边尺寸线跳动,呈现为指数分布或者 Weibull分布[1]。当实际分布与假定分布有较大偏差时,基于分布的参数监控会受到很大影响,监控效果大大下降。针对上述缺陷的解决方法有数据变换方法和使用非参数统计量两种思路,即将过程数据通过映射函数转换成符合正态分布的形式,或使用不依赖于分布的统计量进行监控。用非参数统计量构建的控制图称为非参数控制图。

在过去几年里,非参数控制图已经引起了很多关注,文献[2]针对再制造过程的复杂特性,提出基于Wilcoxon统计量的EWMA控制图;文献[3-4]提出次序秩的非参数EWMA联合控制图和基于马尔可夫均值估计量的自适应CUSUM控制图;文献[5]采用基于在Logistic分布下尺度参数的渐近局部最优势检验作为统计量,构建了LOG控制图;文献[6]考虑同时对分布均值和标准差的监控,提出结合Wilcoxon秩和检验和Ansari-Bradley检验的非参数控制图;文献[7]使用最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)所得到的概率值作为统计量,提出基于LSSVM的多元非参数控制图;文献[8]结合汉密尔顿路径和游程检验,提出了基于游程检验的多元非参数控制图;文献[9]结合多元符号检验,提出了非参数EWMA控制图;文献[10]将多元拟合优度检验与最小生成树结合,设计了SMMST控制图。

本文提出了一种结合Wilcoxon秩和检验和Ansari-Bradley检验的非参数控制图,使用协方差矩阵构建统计量,实现对多变量过程的监控。

1 多元非参数控制图

常用的参数检验需要对总体分布有一定的估计,在对分布有假设的基础上进行检验分析。但在实际数据分析过程中,可能无法对总体分布作简单假定,非参数检验是不涉及总体分布的参数的检验方法,常用秩和作为检验统计量。

通过检验可以判断两分布的参数是否相同,用于描述分布的参数有位置参数、尺度参数、形状参数等。

位置参数是描述分布集中趋势的度量,例如均值和中位数。常用的对位置参数的非参数检验有Wilcoxon秩和检验、游程检验等。

尺度参数是描述分布分散程度的参数。常用的对尺度参数的非参数检验有Ansari-Bradley检验、Levene检验等。

1.1 Wilcoxon秩和检验

假设有样本集X:

X=[X1,X2,…,Xi,…,Xn]

将X排序后得到Xr:

Xr=[X(1),X(2),…,X(k),…,X(n)]

其中,下标(k)表示Xi在X中的次序秩,即Ri=k,Ri为样本X的秩统计量。Wilcoxon秩和检验是基于秩统计量的检验方法,其构建过程如下:

假设有样本集X和Y:

(1)

其中,X服从分布F1(μ1,σ1),Y服从分布F2(μ2,σ2)。

原假设为H0:μ1=μ2,备择假设为H1:μ1≠μ2,定义Wilcoxon秩和检验统计量[2]为:

(2)

其中,N=m+n。统计量Z的均值和方差[2]为:

1.2 Ansari-Bradley检验

假设有样本集X和Y,如式(1)所示。

原假设为H0:σ1=σ2,备择假设为H1:σ1≠σ2,定义Ansari-Bradley检验统计量[6]为:

(3)

其中,N=m+n。统计量T的均值和方差[6]为:

1.3 设计WAB控制图

假设有受控数据样本集X0和质量样本X

(4)

其中,X0~F1(μ1,σ1),X~F2(μ2,σ2),Xi是d维向量。对质量样本X增加扰动δ,观察统计量Z和T的变化情况。取d=2,δ~N(0,1),混合样本集的统计量Z和统计量T的变化情况如图1、图2所示。

图1 扰动为δ时统计量的折线图

图2 扰动为1.5δ时统计量的折线图

观察图1、图2可以发现,当X存在扰动时,统计量Z和统计量T的值都有或大或小的漂移。使用样本协方差矩阵将统计量Z和统计量T结合,使d维向量转换为单个值[11],将其作为统计量构建多元非参数控制图,即定义统计量P为:

(5)

其中,Z是Wilcoxon秩和统计量向量,S是协方差矩阵,T是Ansari-Bradley统计量向量。

使用统计量P构建非参数控制图,记为WAB控制图。WAB控制图同时使用了标准化后的Z统计量和T统计量,放大了漂移,实现对过程的监控。设置控制限h,当P>h时,说明质量样本的分布发生改变,即生产过程失控,发出报警。控制限h的详情将在下面部分给出。

1.4 控制限判定

评价控制图的指标常用平均运行长度(Average Run Length, ARL),ARL分为受控ARL(ARL0)和失控ARL(ARL1)[12]。ARL0指受控状态下控制图第一个虚报样本之前的平均样本数;ARL1指失控状态下控制图发现第一个失控样本之前的平均样本数。本文用蒙特卡罗模拟方法[13]获取控制限h的值,在确定h值时,一般设ARL0=200,计算步骤为:

(1)选取1组受控数据样本集X0。

(2)给定控制限h的初始值。

(3)生成1000组与X0同分布的样本集X。

(4)计算运行链长RL(从第一个移动窗口到控制图首次报警的移动窗口个数)

(5)重复过程(3) ~(5)K次。

(6)计算K个RL值的均值。

(7)如果ARL0接近设定值,则h即为选定的控制限。反之则增大或减小h值并重复上述过程。

2 性能分析

使用本文提出的WAB控制图与T2控制图进行过程失控状态下的性能比较,性能指标使用ARL1。样本数据为:

(6)

其中,x·1服从正态分布,x·2服从Weibull分布。模拟真实生产过程先受控后失控的情况,在Xi,i>500处开始加入扰动δ,δ~N(0,1)。依据上文的方法确定控制限h=0.824,选取(m,n)组合为(50,10)。对不同程度的漂移的ARL1如表1所示。控制图的虚报情况如表2所示。

表1 不同δ下ARL1的值

从表1可以看出,WAB控制图有比T2控制图更高的敏感度,能更快的发现失控情况。在小漂移的情况有明显有优势,随着漂移量的增大,逐渐与T2控制图性能持平。

从表2可以看出WAB控制图基本没有虚报的现象,比T2控制图有更高的稳定性。

表2 不同δ下误报样本的数量

3 应用实例

以某工厂汽车发动机缸盖生产线为例,对提出的WAB控制图进行应用和验证。选取6个质量参数进行监控,采取共100组样本。其样本数据的数据特征,如表3所示。部分质量参数的直方图如图3所示,可以看到存在明显不符合正态分布的参数。

表3 质量参数取值范围表

图3 部分质量参数直方图

根据前文论述的方法,采用WAB控制图对样本数据进行监控,结果如图4所示,在第60个样本处统计量超出控制限,触发报警,而样本实际在57处存在失控。由此可以表明WAB控制图的有效性。

图4 WAB控制图

4 结论

当样本数据不服从多元正态分布时,传统基于多元正态分布的控制图实用性不佳,针对这一缺陷,本文提出了WAB控制图。使用非参数检验的方法,使统计量不依赖于过程分布,同时监控位置参数和尺度参数,通过协方差矩阵构建多元非参数控制图的统计量P。使用蒙特卡罗方法对控制图进行性能分析,与T2控制图进行比对。结果显示,WAB控制图能明显减少由于非正态分布所导致的误报现象,并且可以更快的发现分布漂移,有着更高的灵敏度和准确性。最后,通过汽车发动机缸盖生产过程中6个质量参数的测试数据对WAB控制图的性能进行了验证,结果表明当过程偏移时,WAB控制图能够有效检测出过程偏移。

猜你喜欢
参数检验失控正态分布
一场吵架是如何失控的
定身法失控
基于对数正态分布的出行时长可靠性计算
正态分布及其应用
非参数检验的概念
χ2分布、t 分布、F 分布与正态分布间的关系
失控
基于Copula函数对二维正态分布中常见认识误区的分析
非参数检验的概念
失控的乌克兰