q临界值、ψ值和λ值的含义及其计算

2012-03-11 14:01军事医学科学院生物医学统计学咨询中心100850周诗国胡良平
中国卫生统计 2012年1期
关键词:参数值均数含义

军事医学科学院生物医学统计学咨询中心(100850) 周诗国 胡良平

若要采用Newman-Keuls检验对单因素多水平设计一元定量资料进行两两比较,则需要用到q临界值;若要进行多个总体均数比较时样本含量或检验效能的估计,则通常需要获得相应条件下的ψ值;若要进行多个总体率的比较时样本含量或检验效能的估计,则通常需要获得相应条件下的λ值〔1-3〕。绝大多数统计学教科书或专著都收录了有关这些参数在特定条件下的数值表供读者查阅〔4-11〕,但明确阐述它们的含义及在特定条件下如何计算出它们的数值,却很难寻觅相应的文献资料。本文的目的就在于介绍q临界值、ψ值和λ值的含义及其计算方法。

q 临界值的含义及其计算方法

1.q临界值的含义

当单因素多水平设计一元定量资料的方差分析结果为拒绝H0,接受H1,得出“各总体均数不同或不全相同”的结论时,并不能说明各总体均数两两之间是否不同,为此,可在前述方差分析的基础上,对均数进一步作两两比较,也称多重比较(multiple comparison)。均数间两两比较的方法有多种,Newman-Keuls检验只是其中之一。Newman-Keuls检验亦称Student-Newman-Keuls(SNK)检验,简称q检验。其检验统计量q的计算公式为

式中,¯Xi、¯Xj分别为两对比组的样本均数;S¯Xi-¯Xj为两对比组样本均数差值的标准误;MSe为方差分析的误差均方;ni、nj分别为两对比组的样本含量。统计量q又被称为学生化极差(studentized range)统计量,检验拒绝域为

q≥q(a,v,α) (2)式中,q(a,v,α)为统计量q的临界值,即统计量q所服从的分布(不妨记为q分布)的第100(1-α)百分位数,α 的取值为小数,且有 q≥q(a,v,α)的概率为 α,即P[q≥q(a,v,α)]=α。一般取 α =0.05 或 α =0.01。q(a,v,α)是所比较的两个经排序后的均数之间的跨度a(即每次比较所涉及到的处理组的组数,其最小值为2,最大值为试验因素的水平数k)、方差分析中误差项的自由度v及完全无效假设下的试验误差率(EERC)α的函数。

2.q临界值的计算方法

将正态密度函数看作一个简单函数,则q分布的概率密度函数是一个二重积分的形式,其形状(或图形)随着k、v两个参数的变化而剧烈变化。

要求临界值q(a,v,α),则需求解概率方程P[q≥值就是直接通过数值积分法计算出来的。

目前的SAS软件已经提供了一个可以用来计算q临界值的 SAS 函数,即 PROBMC 函数〔12,13〕。其语法规则如下:

PROBMC(distribution,q,prob,υ,nparms,<parameters>)

式中各个参数的含义如下:

distribution:一个标识分布类型的字符串。对PROBMC函数有效的分布共有5种,见表1。

表1 对PROBMC函数有效的5种分布及其对应的参数值

q:当q等于某个具体的数值时(此时,参数prob的取值必须用·代替),其表示服从参数distribution所代表的某种分布的统计量的值;当q的取值用·代替时(此时,参数prob必须等于一个位于(0,1)之间的具体的数值),表示将通过PROBMC函数求取参数distribution所代表的某种分布曲线下左侧概率为prob的分位数。

prob:相应分布的概率密度曲线下随机变量的取值位于特定分位数左侧的概率。

q与prob必须有且只有一个的取值用·来代替,而PROBMC函数所返回的值正是q和prob两个参数中取值用·来代替的那个参数的值。

υ:方差分析时误差项的自由度,其计算公式为υ=(N-1)-(k-1)=N-k。式中的k表示试验因素的水平数,N表示总样本含量,即k个水平组的样本含量之和。若υ的取值用·来代替,则表示自由度为无穷大(∞)。

nparms:处理组的组数。对DUNNETT1和DUNNETT2所对应的分布,组数不包括对照组。比如有一项单因素5水平设计,若以样本均值最小的那个组作为对照组,采用DUNNETT法比较其他组与对照组的总体均值差异有无统计学意义(此时,参数distribution的取值为‘DUNNETT1'或‘DUNNETT2'),在比较样本均值最大的那个组与对照组之间的总体均值的差异有无统计学意义时,nparms的取值为4;若采用SNK法对5个总体均值进行两两比较,在比较样本均值最大的那个组与样本均值最小的那个组之间的总体均值的差异有无统计学意义时,nparms的取值为5。

parameters:是一个可选项。该选项为一个序列,组成了“nparms”这个参数的具体内容。当试验因素各水平组的样本含量不等时,必须指定该选项。nparms的含义取决于分布的类型。若不指定这些参数,则意味着假定各组的样本含量相等。

对学生化极差,当自由度υ≠∞且各组的样本含量不等时,函数PROBMC无效。

对Williams检验,当各组的样本含量不等时,函数PROBMC也无效。

【例1】 设有某项单因素5水平设计,每个水平组做4次独立重复试验,测量某项定量指标的取值,并假定资料满足方差分析的前提条件,取检验水准α=0.05,经单因素5水平设计一元定量资料的方差分析处理,发现试验因素对试验结果的影响有统计学意义,现欲采用SNK检验进行5个总体均值之间的多重比较,请用SAS计算所需的q临界值。

【分析与解答】 由题意可知,检验水准α=0.05,试验因素的水平数k=5,各水平组的样本含量n=4,故多重比较时的自由度υ=N-k=kn-k=k(n-1)=15。所需求取的 q 临界值为 q(5,15,0.05)、q(4,15,0.05)、q(3,15,0.05)和 q(2,15,0.05),共4 个。可用下面的SAS程序计算出上述q临界值。

data c_q_v;

alpha=0.05;

df=15;/*用df表示自由度υ*/

do a=5 to 2 by-1;

q=probmc("range",.,1-alpha,df,a);

output;

end;

run;

ods html;

proc print data=c_q_v noobs;run;

ods html close;

quit;

计算结果如表2所示。

表2 例1所需的q临界值

alpha df a q 0.05 15 5 4.366 99 0.05 15 4 4.075 97 0.05 15 3 3.673 38 0.05 15 2 3.014 32

ψ值的含义及其计算方法

1.ψ值的含义

从ψ值表中可以看出,ψ值是4个参数的函数,这4个参数分别为进行单因素多水平设计一元定量资料方差分析时的Ⅰ型错误概率α、Ⅱ型错误概率β以及检验统计量F的分子和分母的自由度v1和v2。

此外,方差分析是以F分布为理论依据的。当H0成立时,方差分析的检验统计量F服从分子和分母的自由度分别为v1和v2的中心F分布。当H0不成立时,方差分析的检验统计量F服从分子和分母的自由度分别为v1和v2、非中心参数δ≠0的非中心F分布。中心F分布只是非中心F分布的一个特例(非中心参数δ=0)。根据非中心F分布的非中心参数值的计算方法及相应的SAS函数,笔者对非中心F分布的非中心参数值进行了探索性的计算,并将计算结果与统计学教材或专著中给出的相应条件下的ψ值进行比较,结果表明:ψ值并不是非中心F分布的非中心参数值,而是使方差分析同时满足下面两个条件时的非中心F分布的非中心参数值δ除以试验因素的自由度v1(即检验统计量F的分子的自由度)后开算术平方根的结果,即ψ=。两个条件为:

(1)拒绝H0时可能犯错误的最大概率为α;

(2)不能拒绝H0时,若接受H0,可能犯错误的最大概率为β。

2.ψ值的计算方法

(1)确定单因素多水平设计一元定量资料方差分析的Ⅰ型错误概率α、Ⅱ型错误概率β以及检验统计量F的分子和分母的自由度v1和v2;

(2)用F分布的分位数函数FINV求出与分子和分母的自由度分别为ndf和ddf、分布曲线下左侧概率为1-α的中心F分布对应的分位数FINV(1-α,ndf,ddf);

(3)用非中心F分布的非中心参数函数FNONCT求出与分子和分母的自由度分别为ndf和ddf、分位数为FINV(1-α,ndf,ddf)、分布曲线下左侧概率为β的非中心F分布的非中心参数值FNONCT(FINV(1-α,ndf,ddf),ndf,ddf,β);

此结果与从统计学教材或专著中给出的ψ值表中查到的结果相吻合。

λ值的含义及其计算方法

1.λ值的含义

从λ值表中可以看出,λ值是3个参数的函数,这3个参数分别为进行单因素多水平设计定性资料(结果为二值变量)χ2检验时的Ⅰ型错误概率α、Ⅱ型错误概率β以及自由度v=k-1(k为试验因素的水平数)。

此外,χ2检验是以χ2分布为理论依据的。当H0成立时,χ2检验的检验统计量χ2服从自由度为v=(k-1)(2-1)=k-1的中心χ2分布(结果变量为二值变量)。当H0不成立时,χ2检验的检验统计量χ2服从自由度为v=(k-1)(2-1)=k-1、非中心参数δ≠0的非中心χ2分布(结果变量为二值变量)。中心χ2分布只是非中心χ2分布的一个特例(非中心参数δ=0)。经过对非中心χ2分布的研究及相应SAS函数的运用,笔者发现:λ值就是使χ2检验同时满足本文“ψ值的含义”一节所列出的两个条件时的非中心χ2分布的非中心参数值δ。

2.λ值的计算方法

(1)确定结果变量为二值变量的单因素多水平设计一元定性资料χ2检验的Ⅰ型错误概率α、Ⅱ型错误概率β及自由度v;

(2)根据α和v的值,用χ2分布的分位数函数CINV,计算出自由度为v、分布曲线下左侧概率为1-α的中心χ2分布的分位数CINV(1-α,v);

(3)根据刚刚计算出来的中心χ2分布的分位数CINV(1-α,v)、v和β的值,用计算χ2分布的非中心参数值的函数CNONCT,计算出自由度为v、分位数为CINV(1-α,v)、分布曲线下左侧概率为β的非中心χ2分布的非中心参数值δ=CNONCT(CINV(1-α,v),v,β)。该非中心参数值就是所要计算的λ值,即λ=δ。

比如:当 α =0.05,β =0.10,v=4 时,

λ = δ=CNONCT(CINV(1 - α,v),v,β)

=CNONCT(CINV(1 - 0.05,4),4,0.10)

=15.405 051 859

此结果与λ值表中查到的结果相吻合。

讨 论

采用SAS函数 PROBMC来计算 Newman-Keuls检验用的q临界值,既克服了查q临界值表的不便,又提高了涉及q临界值的SAS程序的自动化水平,还降低了相关问题的求解难度。借助SAS函数PROBMC,不但可以计算相应条件下Newman-Keuls检验的临界值或统计量对应的概率值,而且可以计算相应条件下 其 他 四 种 检 验 (One-sided Dunnett、Two-sided Dunnett、Maximum Modulus、Williams)的临界值或统计量所对应的概率值。

此外,TUKEY法、DUNCAN法和 REGWQ法三种两两比较法用的q临界值或尾端概率值的计算问题也一并得到了解决,因为这三种方法跟Newman-Keuls检验法一样,都要用到q临界值,而且都可以通过SAS函数PROBMC来进行计算,唯一需要注意的是,它们各自所对应的临界值q(a,v,α)中的参数a及α的含义有所不同。

在借助SAS函数FNONCT及FINV计算ψ值时,我们发现:当与检验统计量F的分子和分母对应的两个自由度中至少有一个过大时,SAS程序的返回值为缺失值。这是由于前述条件下SAS函数FNONCT因计算过程不收敛所导致的结果。可见,用SAS函数FNONCT及FINV来计算ψ值的方法并不完美,尚有一些缺陷。不过,实际工作中几乎不会有检验统计量F的分子对应的自由度超过1万或分母对应的自由度超过10亿的情况。因此,用SAS函数FNONCT及FINV来计算ψ值,完全能够满足实际需要。

1.钱俊,陈平雁.假设检验中计算观察检验效能的意义的探讨.中国卫生统计,2005,22(3):133-137.

2.郭静,徐勇勇,何大卫.多组比较样本含量及检验效能的线性算图估计.中国卫生统计,2002,19(2):94-95.

3.钱俊,陈平雁.样本率多重比较方法的模拟研究.中国卫生统计,2009,26(2):131-134.

4.刘桂芬主编.医学统计学.第2版.北京:中国协和医科大学出版社,2007:66-68,177-178,408,422.

5.中国科学院数学研究所概率统计室编.常用数理统计表.北京:科学出版社,1974:14-16,108-112.

6.郭祖超主编.医用数理统计方法.第3版.北京:人民卫生出版社,1988:899.

7.倪宗瓒主编.卫生统计学.第4版.北京:人民卫生出版社,2002:251.

8.马斌荣主编.医学科研中的统计方法.第3版.北京:科学出版社,2005:192.

9.孙振球主编.医学统计学.北京:人民卫生出版社,2002:526.

10.杨树勤主编.卫生统计学.第3版.北京:人民卫生出版社,1996:148-150,202,217,220.

11.Louis L,François-A D.Statistical Tables,Explained and Applied.World Scientific Publishing Company,New Jersey.London.Singapore.HongKong,2002:65-71.

12.朱世武编著.SAS编程技术教程.北京:清华大学出版社,2007:519-522.

13.http://www.sfu.ca/sasdoc/sashtml/lgref/z1016947.htm.

猜你喜欢
参数值均数含义
Union Jack的含义和由来
例谈不等式解法常见的逆用
不等式(组)参数取值范围典例解析
某系列柴油机与电子调速器匹配标准化参数优化
逆向思维求三角函数中的参数值
关于均数与偏差
关于均数与偏差
五星红旗的含义