IIRCT下泊松分布参数单变点的贝叶斯估计

2014-08-24 03:36何朝兵刘华文
关键词:变点泊松贝叶斯

何朝兵,刘华文

(1.安阳师范学院 数学与统计学院,河南 安阳 455000;2.山东大学 数学学院,山东 济南 2501000)

IIRCT下泊松分布参数单变点的贝叶斯估计

何朝兵1,刘华文2

(1.安阳师范学院 数学与统计学院,河南 安阳 455000;2.山东大学 数学学院,山东 济南 2501000)

首先通过添加数据得到了带有不完全信息随机截尾试验下泊松分布的完全数据似然函数,然后研究了变点位置和其它参数的满条件分布,接着利用Gibbs抽样与Metropolis-Hastings算法相结合的MCMC方法对参数进行了估计,最后进行了随机模拟,试验结果表明参数贝叶斯估计的精度较高.

完全数据似然函数;满条件分布;MCMC方法;Gibbs抽样;Metropolis-Hastings算法

变点分析研究始于20世纪50年代,自20世纪70年代初,这一问题引起了一些编译学家的重视,发展了一些变点分析方法[1-3],如最小二乘法、极大似然法、贝叶斯法和非参数方法等.随着统计计算技术的快速发展,贝叶斯方法的应用越来越广泛,特别是在水文统计[4,5]和计量经济[6]等领域.而贝叶斯计算方法中的Markov chain Monte Carlo(MCMC)方法,使变点分析中贝叶斯方法的实际操作变得非常方便.泊松分布是一类应用广泛的离散型寿命分布,它可以作为多种不同类型试验的模型,泊松分布的另一个应用是研究空间分布,例如湖泊中鱼群数量的分布.文献[7-12]对泊松分布进行了深入研究,其中文献[12]研究了II型截尾情形下泊松分布参数的极大似然估计.近些年来,关于随机截尾试验的研究比较多,带有不完全信息随机截尾试验(random censoring test model with incomplete information),简称IIRCT,由文献[13]首次涉及,接着文献[14-20]深入研究了IIRCT下连续型分布的参数估计.实际上,文献[12]研究的II型截尾试验是特殊的IIRCT.而对IIRCT下寿命分布参数的变点问题,却很少有文献研究.下文主要研究了IIRCT下泊松分布参数单变点的贝叶斯估计.首先通过添加数据得到了IIRCT下泊松分布的完全数据似然函数,然后研究了变点位置和其它参数的满条件分布,接着利用Gibbs抽样与Metropilis-Hastings算法相结合的MCMC方法得到了参数的Gibbs样本,把Gibbs样本的均值作为各参数的贝叶斯估计,最后进行了随机模拟,试验结果表明各参数贝叶斯估计的精度都较高.

1 离散型寿命IIRCT

设产品寿命X1,X2,L是独立同分布的离散型随机变量序列,其分布函数为F(x,λ)=P(Xi≤x),分布为f(x,λ),λ是未知参数.又设Y1,Y2,L是独立的取非负整数的离散型随机变量序列,分布函数分别为G1(y),G2(y),L.分布律分别为g1(y),g2(y),L,且gi(y)与参数λ无关.{Xi}与{Yi}独立.

为估计参数λ,n个样品的观察数据{Zi,1≤i≤n}如下:

(1)当Xi≤Yi时,有两种情况:Xi以概率ai立即显示,此时取Zi=Xi;Xi以概率1-ai不被显示,此时取Zi=Yi,称ai为失效显示概率.

(2)当Xi>Yi时,取Zi=Yi.

引入随机变量αi,βi,i=1,2,L,n.

若Xi≤Yi,αi=1;若Xi>Yi,αi=0.

若Xi≤Yi,且未被显示时,βi=0;其它情况,βi=1.

综上所述,有

设Zi的观察值为zi,则基于数据{(zi,αi,βi),1≤i≤n}的似然函数为

2 IIRCT下泊松分布参数的完全数据似然函数

若X的分布律为P(X=k)=λke-λ/k!,k=0,1,L,则称X服从参数为λ的泊松分布,记为X~P(λ).假设IIRCT下产品寿命X~P(λ).

令α表示αi组成的向量,β表示βi组成的向量,z表示z组成的向量.

泊松分布P(λ)基于数据{(zi,α,βi),1≤i≤n}的似然函数为

从上式可以看出,基于截尾数据的似然函数比较复杂,为了方便进行参数估计,下面添加缺损的Xi的值,以获得完全数据的似然函数.具体如下:

当αi=1,βi=0,即第i个产品失效未被显示时,添加数据Z1i=Xi=z1i.

在Xi≤zi的条件下,Z1i的条件分布律为

当αi=0,即Xi>Yi时,添加数据Z2i=Xi=z2i.

在Xi>zi的条件下,Z2i的条件分布律为

令u表示z1i组成的向量,v表示z2i组成的向量,则完全数据似然函数为

3 IIRCT下泊松分布参数单变点的贝叶斯估计

泊松分布参数单变点模型如下:

其中λ1,λ2两两不相等,1≤k≤n-1.

下面对变点位置k及参数λ1,λ2进行贝叶斯估计.

记θ=(k,λ1,λ2),则IIRCT下泊松分布参数单变点问题的似然函数为

下面确定各参数的先验分布.

(2)取λi的先验分布为共轭先验分布伽玛分布Ga(bi,ci),bi,ci已知,即

假设k,λ,λ2独立.则

L(θ|z,u,v,α,β)∝π(k)π(λ1)π(λ2)L(z,u,v,α,β|θ)

当αi=1,βi=0时,

其中z-1i={z1j:j≠i}.

当αi=0时,

其中z-2i={z2j:j≠i}.

为了书写方便,把满条件分布中的“条件”用“·”代替,例如

π(λ1|k,λ2,z,u,v,α,β)简记为π(λ1|·).

各参数的满条件分布为

由于得到了各参数的满条件分布,下面利用MCMC方法获得各参数后验分布的平稳分布.参数z1i,z2i的满条件分布是截断泊松分布,可以利用逆变换法随机抽样,λ1,λ2的满条件分布是伽玛分布,这4个分布都可以采用Gibbs抽样;但是k的满条件分布不是标准分布,进行Gibbs抽样比较困难,可以利用Metropolis-Hastings算法进行抽样,此时选取建议分布为取值1,2,L,n-1的离散型均匀分布.

下面写出MCMC方法的具体步骤:

从1,2,L,n-1中任取一个k′,产生一个随机数u0,若u0≤r(k(t-1),k′),则k(t)=k′,否则k(t)=k(t-1).

4 随机模拟

基于上面的讨论,下面进行随机模拟试验.取受试样品的个数n=200,样品寿命Xi:P(10),i=1,2,L,50;Xi:P(30),i=51,52,L,200.则参数(k,λ1,λ2)的真实值为(50,10,30).取λ1,λ2的先验分布分别为Ga(7,0.6),Ga(35,1.2),截尾变量Yi~P(32),失效显示概率a=0.8.

利用前面推导出的各个参数的满条件分布使用R软件进行MCMC模拟.在模拟运行过程中,先进行10000次Gibbs预迭代,以确保参数的收敛性,然后丢弃最初的预迭代,再进行10000次Gibbs迭代.迭代从第10001次开始至第20000次的R程序的运行结果见表1.

表1 参数k,λ1,λ2的贝叶斯估计

最后,进行模拟结果分析.由表1可以看出各参数的估计值与真值的相对误差都小于3%,精度较高,效果较好;各参数的MC误差较小,Gibbs迭代值的波动较小,Gibbs迭代比较稳定.综上分析,可以看出通过MCMC模拟所产生的效果较好.

注:编写R程序时用到的函数主要有pois(),gamma(),min(),runif(),apply(),sum(),mean(),sd(),quantile(),plot(),points(),legend()等.

[1] CSÖRGÖ M, HORVTH L. Limit theorems in change-point analysis[M]. New York: Wiley, 1997.

[2] 陈希孺.变点统计分析简介[J].数理统计与管理,1991,10(1):55-59.

[3] 项静怡,史久恩.非线性系统中数据处理的统计方法[M].北京:科学出版社,1997.

[4] 熊立华,周芬.水文时间序列变点分析的贝叶斯方法[J].水电能源科学,2003,21(4):39-41.

[5] PERREAULT L, BERNIER J, BOBÉE B, et al. Bayesian change-point analysis in hydrometeorological time series. Part 1. The normal model revisited[J]. Journal of Hydrology, 2000,235(3):221-241.

[6] KOTZ S, 吴喜之.现代贝叶斯统计学[M].北京:中国统计出版社,2000.

[7] LU W, SHI D. A new compounding life distribution: the Weibull-Poisson distribution[J]. Journal of Applied Statistics, 2012,39(1):21-38.

[8] BARRETO-SOUZA W, CRIBARI-NETO F. A generalization of the exponential-poisson distribution[J]. Statistics & Probability Letters, 2009,79(24):2493-2500.

[9] POISSON S D. Recherches sur la probabilité des jugements en matiére criminelle et en matière civile, précédées des règles générales du calcul des probabilités[M]. Bachelier, 1837.

[10] BARBOUR A D, HOLST L, JANSON S. Poisson approximation[M]. Oxford: Clarendon Press, 1992.

[11] 刘银萍,马晓悦,赵志文.缺失数据场合泊松分布参数的贝叶斯估计[J].吉林师范大学学报:自然科学版,2012,33(3):13-15.

[12] 刘银萍,宋立新.II型截尾情形下泊松分布参数的估计[J].吉林大学学报:理学版,2007,45(6):941-944.

[13] ELPERIN T I, GERTSBAKH I B. Estimation in a random censoring model with incomplete information: exponential lifetime distribution[J]. IEEE Transactions on Reliability, 1988,37(2):223-229.

[14] ELPERIN T, GERTSBAKH I. Bayes credibility estimation of an exponential parameter for random censoring and incomplete information[J]. IEEE Transactions on Reliability, 1990,39(2):204-208.

[15] YE E. Consistency of MLE of the parameter of exponential lifetime distribution for random censoring model with incomplete information[J]. Applied Mathematics, 1995,10(4):379-386.

[16] 陈怡南,叶尔骅.IIRCT下对数正态和正态分布参数的MLE[J].南京航空航天大学学报,1996,28(3):376-383.

[17] 陈怡南,叶尔骅.带有不完全信息随机截尾试验下Weibull分布参数的MLE[J].数理统计与应用概率,1996,11(4):353-363.

[18] 杨纪龙,叶尔骅.带有不完全信息随机截尾试验下Weibull分布数参的MLE的相合性及渐近正态性[J].应用概率统计,2000,16(1):9-19.

[19] 张晓琴,张虎明.带有不完全信息随机截尾试验下Weibull分布参数的MLE的重对数律[J].应用概率统计,2002,18(1):101-107.

[20] 宋毅君,李补喜,李济洪.带有不完全信息随机截尾试验下最大似然估计的重对数律[J].应用概率统计,2009,25(2):113-125.

BayesEstimationofParameterofPoissonDistributionwithSingleChangePointforRandomCensoringTestModelwithIncompleteInformation

HE Chao-bing1, LIU Hua-wen2

(1. School of Mathematics and Statistics, Anyang Normal University, Anyang 455000, China; 2. School of Mathematics, Shandong University, Jinan 250100, China)

This paper firstly obtained the complete-data likelihood function of Poisson distribution for IIRCT after adding data, then studied the full conditional distributions of change-point position and other parameters, and estimated the parameters by MCMC method of Gibbs sampling together with Metropolis-Hastings algorithm. Finally random simulation tests were conducted, and the results showed that Bayes estimations of the parameters were fairly accurate.

complete-data likelihood function; full conditional distribution; MCMC method; Gibbs sampling; Metropolis-Hastings algorithm

2013-09-22

国家自然科学基金(61174099);河南省教育厅自然科学基金资助项目(2011B110001).

何朝兵(1975-),男,河南周口人,讲师,硕士,主要从事概率统计的研究.

何朝兵,刘华文.IIRCT下泊松分布参数单变点的贝叶斯估计[J].安徽师范大学学报:自然科学版,2014,37(4):335-338.

O213.2;O212.8

A

1001-2443(2014)04-0335-04

猜你喜欢
变点泊松贝叶斯
基于泊松对相关的伪随机数发生器的统计测试方法
一类带有两个参数的临界薛定谔-泊松方程的多重解
回归模型参数的变点检测方法研究
基于贝叶斯解释回应被告人讲述的故事
带有双临界项的薛定谔-泊松系统非平凡解的存在性
正态分布序列均值变点检测的贝叶斯方法
基于二元分割的多变点估计
独立二项分布序列变点的识别方法
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习