对参数假设检验中几对关系的研究

2012-09-21 08:21代婷
中国科技信息 2012年18期
关键词:假设检验区间概率

代婷

济南职业学院基础部, 济南 250014

对参数假设检验中几对关系的研究

代婷

济南职业学院基础部, 济南 250014

A Research on several couples of relationships of the Hypothesis Testing

参数假设检验中存在四对密切相关的概念:原假设与备择假设、两类错误、P-值法与临界值法、区间估计与假设检验,深入了解这些概念及其原理之间的关系有利于准确把握假设检验的思想与方法。

参数假设检验;原假设与备择假设;两类错误;P-值法与临界值法;区间估计与假设检验

假设检验是统计推断的一种重要方法,包括参数假设检验和非参数假设检验,参数假设检验即研究者事先对未知参数做出假设,再利用样本信息对做出的假设进行检验。其应用可涉及社会生活中的各个领域,如经济管理、医学研究、教育管理等。而假设检验的应用过程中,存在几对关系,是正确理解和应用的关键,若不能正确理解,便会导致方法失效,甚至带来不良后果,因此有必要深入系统地对这几对关系进行研究。

1 原假设与备择假设

按照假设检验的原理及步骤,首先要根据问题对总体参数做一个尝试性的假设,该尝试性的假设即为原假设H0,而后再定义另一个与原假设的内容完全相反的假设,记为H1,称作备择假设。在假设检验的过程中,二者成对出现,但在应用中,如何建立原假设和备择假设并不显而易见,二者若交换,就会得到相反的结论。

例如,某品牌电视机生产厂家,声称其产品合格率达到95%以上,质管部门随机抽取了500台进行检验,经检验,发现480台为合格品,那么根据样本数据,有充分理由相信该厂家的说法吗?(a=0.05)

解:首先经判断,确定检验统计量为

说明Z未落入拒绝域,因此不能拒绝H0,即没有理由认为该产品合格率低于95%。

模式二,假设

同样,Z未落入拒绝域,因此不能拒绝原假设,即没有理由认为该产品合格率超过95%。

在上例中,同样的样本,同样的检验统计量,当交换原假设和备择假设后却得到两个不同的结论,从区间的角度来看,产生这一现象的原因是,在一定的显著性水平 a下,模式一的接受域为:[-Za,+∞),交换原假设后,接受域为(-∞,Za],因此两种情况下,接受域有公共交集[-Za,Za],当样本观测值落入该交集后,则会产生相反的结论。因此,若想改变这种现象,可以适当提高显著性水平,从而缩小接受域的交集。另外,还要慎重选择原假设。根据皮尔逊和奈曼的统计思想,当原假设为真时,拒绝原假设(即第一类错误)的概率为显著性水平a,而a一般很小,且可以控制,所以提倡设置原假设时,在控制第一类错误的概率a下,尽量使第二类错误的概率β小,即我们只对犯第一类错误的概率a加以限制,而对β的具体取值不用考虑,因此,假设检验的目的更倾向于拒绝H0,而H0往往是受保护的,要想拒绝它需要很充分的证据。所以在设定原假设时,一般遵循如下原则:

1 ) 原假设往往是有事实依据的,没有足够的证据一般不能拒绝。

2 ) 应把拒绝时导致的后果更严重的假设作为原假设。

3 ) 无论是单侧检验,还是双侧检验,等号往往出现在原假设中,即如下三种形式:

2 第一类错误与第二类错误

假设检验的基本思想是小概率原理,即认为小概率事件在一次试验中几乎不可能发生,但不等于绝对不发生,于是存在两类错误,H0为真却拒绝的错误为弃真错误,即第一类错误,其概率为显著性水平a,是在研究设计时根据不同研究目的预先规定的允许犯第一类错误概率的最大值。反之,若H0不真而被接受,则形成取伪错误即第二类错误,其概率记作β。

在假设检验的过程中,不对β进行设置,因此,不能只根据检验统计量的概率P>a就盲目接受H0,而只能说“不能拒绝H0”,相反,若p≤a,就可以明确下结论:拒绝H0,因为,犯第一类错误的概率不会超过事先制定的概率a。

以样本均值与总体均值比较的单侧Z检验为例,说明a与β的关系。设,若H0为真,由

则不能拒绝H0,此时犯第二类错误,概率为β,从图中可见两种错误之间的关系:

1 ) α+β不一定等于1;

2 ) 在其他条件不变的前提下,两类错误一个增大,则另一个就减小。在图中可见,当临界值Xα向右移动时,α减小,则β变大,反之亦然。

3 P-值法与临界值法

当用检验统计量的值来提供证明是否拒绝H0时,可以借助两种方法:P-值法与临界值法。P-值是一个概率值,是由检验统计量的样本观测值得出的原假设可被拒绝的最小显著性水平,用来衡量样本对原假设的支持程度,P-值越小,说明对原假设的支持程度就越低。

临界值是指导致拒绝原假设的检验统计量的最大值。同样以正态总体中均值μ的检验为例,检验统计量仍为,左侧检验时,若Z≤-Za,则拒绝H0,此时,-Za为临界值,即标准正态分布的下侧面积对应于α的Z值;右侧检验时,若Z≥Za,则拒绝H0;双侧检验时,|Z|≥-Za/2,则拒绝H0。

根据上述对P-值法和临界值法的应用原理的描述,可以得到两者之间的关系为:

1 )、两种方法计算所得出的有关假设检验的结论肯定相同。

2 )、当α= P 值时,则P-值法中统计量的值A 刚好等于临界值。

3 )、P-值法能更充分验证结果的显著程度,是一种实测显著性水平,而临界值法只能验证在给定的显著性水平下是否显著。

4 区间估计与假设检验

参数的区间估计与假设检验都是用样本来统计推断总体的方法,两者在理论和方法上具有很强的相通性。

以对总体均值进行估计为例,在σ已知的情况下,总体均值的100(1-α)%置信区间估计为,说明在置信区间中,有100(1-α)%将总体均值包括在内,有100α%没有将总体均值包括进去,说明在原假设为真时,以概率α拒绝它。因此,构造一个100(1-α)%置信区间并且当区间不包括μ0时拒绝,等价于在显著性水平α下进行双侧假设检验。

从上述两种方法的相通上可以得出二者有着如下关系:

1 ) 两者解决问题思想方法一致,都是利用样本资料来推断总体指标,在推断过程中,选取同样的统计量,使该统计量落在某个已知区间上的概率为 。

2 ) 两种方法推断的结果都有一定的可信度和风险性。

3 ) 区间估计的置信度100(1-α)%与假设检验中的显著性水平 密切相关,而置信区间与假设检验中的接受域相同。

4 ) 对已知资料的掌握程度不同。区间估计对未知参数一无所知,利用样本资料,在一定的保证程度下估计出它的可能范围。而假设检验对未知参数有所了解,但不能确定,因此在一定的显著性水平下进行判断。

5 ) 由相同的统计量构造的事件不同。区间估计得到的是一个大概率(100(1-α)%)事件,而假设检验利用的是小概率(α)事件。

5 小结

假设检验在现实生活中应用广泛,但在应用的过程中,若不能准确把握其中的思想及运算方法,则不能有效实现它的用途,本文沿着设置假设到完成检验的过程,从深入剖析假设检验中几对重要关系出发,对假设检验的精髓进行了深入的分析,希望为该推断方法的学习与应用提供参考。

[1]Anderson,D.R等.商务与经济统计[M](第10版).机械工业出版社 ,2010.1

[2]颜虹.医学统计学[M](第2版).人民卫生出版社 ,2010.8

[3]苏再兴,王志福等.从区间估计的角度思考假设检验问题[J].科技信息 ,2010(25)

10.3969/j.issn.1001-8972.2012.18.016

代婷,1982年生人,女,汉族,山东济南人,硕士,单位:济南职业学院,研究方向:数学教育。

AbstractThere are 4 pairs of relationships in the Hypothesis Testing: null hypothesis and alternative hypothesis、two types of errors、the P-value method and the critical value method、Interval estimation and hypothesis testing,A thorough understanding of the relationships of these concepts and principles is very useful to grasp the thought and method of the Hypothesis Testing.

KeywordsParameter hypothesis testing; null hypothesis and alternative hypothesis; two types of errors; the P-value method and the critical value method; Interval estimation and hypothesis testing

猜你喜欢
假设检验区间概率
你学会“区间测速”了吗
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
假设检验结果的对立性分析
全球经济将继续处于低速增长区间
统计推断的研究
凤爪重量质量管理报告
区间对象族的可镇定性分析