如何正确运用χ2检验
——人-时间资料率比分析与SAS实现

2021-09-10 02:53胡纯严胡良平
四川精神卫生 2021年4期
关键词:置信区间密度乳腺癌

胡纯严,胡良平,2*

(1. 军事科学院研究生院,北京 100850;2. 世界中医药学会联合会临床科研统计学专业委员会,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

在分析“人-时间资料”时,若基于“人-年数”,在所考察的处理因素分别处于“暴露”与“非暴露”水平下,求出两组受试对象各自的“发病密度”之后,再求出两“发病密度”之比,就获得了“率比”[1],它类似于分析通常四格表资料所采用的效应指标“相对危险度”或“优势比”[2-5];但在文献[6]中,直接将“率比”称为“相对危险度”。本文将介绍与“率比分析”有关的内容以及基于SAS 软件实现计算的方法。

1 分层人-时间资料中第i 层率比的点估计和置信区间估计

1.1 分层人-时间资料的列表格式

分层人-时间资料的列表格式见表1。

表1 分层人-时间资料的列表格式

1.2 第i层率比的点估计及置信区间估计

第i层“率比”是该层中“暴露水平”下的“发病密度(α1i/t1i)”与“非暴露水平”下的“发病密度(α2i/t2i)”之比值,相当于通常定性资料中的“相对危险度”或“优势比”[2-5]。计算方法见式(1):

第i层率比RRi的100(1-α)%置信区间的计算见式(2):

2 不同层间率比的齐性检验

为了将各层资料合并起来估计“合并率比”,资料需满足的前提条件是各层率比相等,这就需要进行不同层间率比的齐性检验[1,6]。设分层因素共有K个水平,齐性检验的检验假设如下:

H0:RR1=RR2=…=RRk;H1:至少两个层的RRi不同;α=0.05。

检验统计量见式(5):

式(5)中,RRi为第i层率比[见式(1)];Wi为第i层权重,RR为合并率比,其计算分别见式(6)、式(7):

在式(6)中,Var[ln(RRi)]为ln(RRi)的方差,计算方法见式(8):

在式(7)中,指数C的计算方法见式(9):

3 合并率比的点估计与置信区间估计

当各层率比满足齐性要求时,可以对合并率比进行点估计和置信区间估计[1,6]。合并率比的点估计见式(7)和式(9);合并率比的100(1-α)%置信区间估计见式(10):

4 分层人-时间资料率比分析与SAS实现

4.1 分层人-时间资料的实例

文献[1]提供了一个分层人-时间资料,见表2。

表2 绝经后期妇女是否使用口服避孕药(OC)患乳腺癌情况的调查结果

4.2 分层人-时间资料各层率比齐性检验

【例1】试分析表2 资料中“过去使用OC”与“从不使用OC”两组妇女各年龄组中,乳腺癌发病的率比是否满足齐性要求。

【分析与解答】设所需要的SAS程序[6-7]如下:

以上输出结果为:χ2het=0.30263、P=0.98964,说明各层率比满足齐性要求。

4.3 分层人-时间资料各层和合并率比的点估计与置信区间估计

【例2】如表2资料,试分析“过去使用OC”与“从不使用OC”两组妇女各年龄组中乳腺癌发病的率比点估计及置信区间估计;进而求“过去使用OC”与“从不使用OC”两组妇女乳腺癌发病合并率比的点估计及置信区间估计。

【分析与解答】设所需要的SAS程序[6-7]如下:

【SAS输出结果及解释】

以上输出结果是5 个年龄组各自率比(RR_a)及其95%置信区间的下限(c_low)与上限(c_up)的估计值,5个置信区间都包含1,说明各年龄组“过去使用OC”与“从不使用OC”的妇女乳腺癌发病率比与1 之间差异无统计学意义,即各层中“过去使用OC”与“从不使用OC”的妇女乳腺癌发病密度相等。

以上输出结果是合并率比(RR)及其95%置信区间下限(c_low)和上限(c_up)的估计值。

【统计结论和专业结论】由以上输出可知,置信区间包含1,说明“过去使用OC”与“从不使用OC”两组妇女乳腺癌发病率比与1 之间差异无统计学意义,即整体而言,“过去使用OC”与“从不使用OC”的妇女乳腺癌发病密度相等。

5 分层人-时间资料中发病密度的线性趋势检验

5.1 分层人-时间资料中发病密度线性趋势检验的资料列表格式

假设有一个暴露变量(或危险因素)E,而E有k个水平,第j个暴露水平组用得分Sj表示,这个Sj可以是该组内平均暴露水平,如果没有明显的计分方法,也可以用整数1,2,…,k代表k个计分。见表3。

表3 有k个暴露水平的分层的人-时间资料的列表格式

5.2 分层人-时间资料中发病密度线性趋势检验的计算公式

基于表3 中的符号,设pij代表第i层中第j暴露水平上的真实发病密度;p^ij代表第i层中第j暴露水平上的观察发病密度[1,6]。

假设ln(pij)=αi+βSj,使用双侧检验及显著性水平为α。

第一步:建立检验假设,确定检验水准。

H0:β=0;H1:β≠0;α=0.05。

第二步:计算检验统计量。

上式中分子与分母的计算分别见式(14)、式(15):

上面两式中,Lxy和Lxx的计算分别见式(16)、式(17):

在式(16)中,A、B、C的计算公式分别见式(18)、式(19)、式(20):

在式(17)中,D、E的计算分别见式(21)、式(22):

在上面各式中,wij=αij=第i层第j暴露水平上的病例数。

第三步:根据检验统计量的值确定P值,并作出统计推断和专业结论。

5.3 分层人-时间资料中发病密度线性趋势性检验的SAS实现

【例3】某地镍精炼工人肺癌死亡资料如表4 所示[6],试问镍精炼工人的肺癌死亡密度是否随着镍暴露量的增加呈增高趋势?

表4 某地镍精炼工人肺癌死亡情况调查结果

【分析与解答】设所需要的SAS程序如下:

【统计结论和专业结论】由以上SAS输出结果可知,Z=1.58907,P=0.11204>0.05,说明β^=0.25453 与0之间差异无统计学意义;可以认为:肺癌死亡密度不随镍暴露量的增加呈线性增高趋势。

6 讨论与小结

6.1 讨论

对人-时间资料进行分析,与对通常的定性资料[2-5]进行分析是大同小异的。从效应指标上来看,用“发病密度”取代了“发病率”,用“率比”取代了“相对危险度(适用于队列研究设计四格表资料)”和/或“优势比(适用于病例对照研究设计四格表资料)”。稍有不同的是:在分析通常的定性资料时,若各层间满足或不满足齐性要求,分别由基于“固定效应模型”或“随机效应模型”导出的公式去估计“合并或共同”相对危险度或优势比及其置信区间[2-5,8-13];而分析人-时间资料时,若各层间满足齐性要求,有方法估计“合并或共同”率比及其置信区间[1,6];而当各层间不满足齐性要求时,目前尚没有方法估计“合并或共同”率比及其置信区间。

6.2 小结

本文介绍了“分层人-时间资料中第i层率比的点估计和置信区间估计”“不同层间率比的齐性检验”“合并率比的点估计与置信区间估计”和“分层人-时间资料线性趋势性检验”等方法;通过两个实例,介绍了基于SAS 软件实现前述各种场合下的统计计算的过程,对SAS输出结果进行解释,并做出统计结论和专业结论。

猜你喜欢
置信区间密度乳腺癌
绝经了,是否就离乳腺癌越来越远呢?
中医治疗乳腺癌的研究进展
基于预警自适应技术的监控系统设计
效应量置信区间的原理及其实现
别逗了,乳腺癌可不分男女老少!
“密度”练习
密度的应用趣谈
密度的不变性与可变性
吃错了 小心得乳腺癌!