诊断试验缺失值处理方法的比较研究及应用

2013-09-07 09:02中国医学科学院北京协和医学院国家心血管病中心阜外心血管病医院心血管疾病国家重点实验室医学研究统计中心100037

中国卫生统计 2013年4期

关键词：预测值受试者阴性

中国医学科学院北京协和医学院国家心血管病中心阜外心血管病医院心血管疾病国家重点实验室医学研究统计中心(100037)

黄耀华唐欣然王杨李卫Δ

诊断试验缺失值处理方法的比较研究及应用

中国医学科学院北京协和医学院国家心血管病中心阜外心血管病医院心血管疾病国家重点实验室医学研究统计中心(100037)

黄耀华唐欣然王杨李卫Δ

目的探讨诊断试验中缺失值的处理方法并进行比较。方法分别介绍诊断试验常用的4种缺失值处理方法:完整数据法(complete case，CC)，随机缺失法(missing at random，MAR)，最差值法 (worst case，WC)以及无信息结转法(non-informative imputation，NI)，采用不同方法对实例数据进行填充，分别从诊断试验灵敏度、特异度、阳性预测值和阴性预测值四个方面评价缺失值的填充效果。结果无信息结转法与传统缺失值处理方法比较，相对保守且假设简单。结论当诊断试验中诊断结果存在缺失值时，无信息结转方法可以较保守地估计真实的诊断效果。

诊断试验缺失值无信息结转

△通信作者:李卫，Email:liwei@mrbc-nccd．com

诊断试验常常由于某些原因无法得到试验产品的诊断结果。例如，金标准检测方法为有创方法，受试者拒绝参与，样本受损无法进行诊断检测，诊断结果处于灰色区域等。目前，业内通常会采用贝叶斯模型〔1－2〕处理金标准结果缺失的数据;而对于新的诊断试剂或方法诊断结果的缺失，研究者将采用完整数据法、最差值法，但都不大理想，无法客观评价诊断试验的真实效果。在此类诊断试验中，探讨缺失值的填充过程应该遵循尽量保守而且所提假设要尽可能少的原则〔3〕，这样填补后的缺失值才更有可能和实际情况一致。本文通过理论推导阐述二分类诊断试验缺失值的四种处理方法，并采用一项丙肝抗体检测试剂盒研究的数据作为实例说明，从而为选择适合诊断试验中存在缺失值的分析方法提供依据。

方法

诊断试验结果用T表示，T=1表示诊断阳性，T=0表示诊断阴性;D表示受试者金标准的结果，D=1表示受试者为患病状态，D=0表示受试者为健康状态。NA表示未获得诊断结果的人数。简单二分类诊断试验评价结果表示为表1。

表1 诊断试验评价

在一项诊断试验中，具备完整数据病例的分布a，b，c，d值是可以获得的，而缺失值中的a0，b0，c0，d0是无法得到的，只能得到经过金标准诊断之后a0，c0之和以及b0，d0之和。只有在获取a0/c0，b0/d0情况下，研究者才能评价该诊断试验中所有受试者的各项评价指标。

1.完整数据法

一般情况下，我们只分析具有明确诊断结果的完整数据，传统的有偏分析中灵敏度Se=a/(a+c)、特异度Sp=d/(b+d)、阳性预测值PPV=a/(a+b)及阴性预测值NPV=d/(c+d)。

2.随机缺失法

3.最差值法

4.无信息结转法

假设〔3〕是指在整个受试人群中诊断为阳性人数与诊断为阴性人数比值与患病状态无关，而且在获得完整数据的病例和诊断结果缺失的病例中该比例为一固定值。

实例分析与结果

实例将采用一项丙肝病毒抗体检测试剂盒的临床研究数据，数据如表2。

1.完整数据法

2.随机缺失法

疾病状态下的受试者诊断为阳性所占的比例为35/54，所以诊断结果缺失的7名患者中诊断为阳性的人数应为7×(35/54)=4.54，诊断为阴性的人数应为2.46;而健康状态下的13名受试者诊断为阳性的比例为15/152，所以缺失的13名受试者诊断为阳性人数为13×(15/152)=1.28，诊断为阴性的人数应为11.72。由此可获得该诊断试验的各项评价指标，Se=(35+4.54)/(35+19+7)=64.8%，SP=(137+11.72)/(137+15+13)=90.1%，PPV=(35+4.54)/(35+4.54+15+1.28)=70.8%，NPV=(137+11.72)/(19+2.46+137+11.72)=87.4%。

表2 丙肝抗体检测试剂盒试验评价

3.最差值法

在该假设下，疾病状态下的7例缺失数据诊断结果都为阴性，而健康状态下的13名受试者诊断结果都为阳性。进而可以计算得到Se=35/(35+19+7)=57.4%，Sp=137/(137+15+13)=83.0%，PPV=35/(35+15+13)=55.6%，NPV=137/(19+137+7)=84.0%。

4.无信息结转法

诊断结果中阳性所占的比例与疾病状态无关，因此可以获得有完整数据受试者中诊断结果为阳性的比例，50/156。而在诊断结果缺失的7名患者和13名健康受试者中，其诊断结果阳性的比例也为该值。因此，可以分别计算出两部分缺失数据诊断为阳性和诊断为阴性人数。在疾病状态下的受试者中诊断为阳性的有7×(50/156)=2.24，诊断为阴性的有4.76;健康状态下的受试者诊断为阳性的有13×(50/156)=4.17，诊断为阴性的有8.83。由此可以计算Se=(35+2.24)/(35+19+7)=61.0%，Sp=(137+8.83)/(137+15+13)=88.4%，PPV=(35+2.24)/(35+2.24+15+4.17)=66.0%，NPV=(137+8.83)/(137+8.83+19+4.76)=86.0%。

5.四种评价方法的比较

通过对四种评价方法得到的结果进行比较发现，CC方法和MAR填补方法有相同的灵敏度和特异度，在阳性、阴性预测值方面，CC填补方法较MAR有更高的阴性预测值和偏低的阳性预测值。WC填补方法各项评价指标均最低。而NI填补方法所获得的评价指标位于CC、MAR、WC三种方法之间，可以保守地估计诊断试验的评价效果，但又不会过于保守。

表3 四种缺失值处理方法得到诊断结果的比较(%)

讨论

诊断结果出现缺失值问题在诊断试验中较为常见，尤其是在当样本不适用新的诊断方法，或者样本的诊断结果无法评价时，缺失值更是无法避免的现象〔3，5〕。在评价一项诊断试验中，存在一定数量的缺失值往往会影响评价指标的真实性和准确性。因此，采用合适的填补方法对缺失数据进行填补对于客观评价一项诊断试验就显得至关重要了。

本文列举了简单二分类诊断试验存在缺失值时四种分析方法。传统的有偏评价CC并不能全面反应诊断试验的诊断效果，其所得出的各项评价指标在四种评价方法中不够保守，会一定程度地高估诊断试验的效果。这种方法虽然简单，但其带来的问题显而易见，一方面它可能造成巨大的信息丢失，另一方面会造成纳入分析的样本量大大减少，从而降低了统计把握度。

而在MAR填补方法中，缺失值的填补是由受试者本身的疾病状态所决定，因此在诊断试验填充后的灵敏度和特异度与完全数据集下得到的结果一致，阳性预测值甚至比完全数据集还要略高。这个结果说明该填补方法不够保守，在评估一项产品的性能中需要谨慎使用。

在最为保守的填补方法WC中，其填补思想是将缺失数据都视为诊断结果错误。该填补方法固然保守，能低估诊断试验的各项评价指标，但其获得的指标肯定要比真实世界的各项指标低，在大多数诊断试验中将大大低估诊断试剂或诊断器械的诊断能力。在临床试验中，这种保守的方法可作为灵敏度分析的一种策略，如果其结果仍旧满足临床需求，则更能强有力证明产品有效性的稳定程度。

相比其他几种方法而言，NI填补方法具有一定的优势。首先，它的假设足够简单，即假定缺失值的真实情况和受试者的疾病状态无关，这样的假设单一又足够简单，满足填充缺失值假设所遵循的原则。其次，这种方法足够保守，前面的公式推导已经证明在该假设下所计算的灵敏度和特异度比CC方法得到的结果要低，但又不会像WC方法一样过于保守。该方法用在诊断试验的缺失值填补中会比较客观地估计诊断产品的疗效〔6〕。

理论上可以将NI填补方法由简单的二分类诊断试验推广到连续变量诊断试验缺失值的填充。但在连续变量的诊断试验中，填充方法是否会受到Cut-off值的影响，缺失值的具体填充如何操作等等，这类问题将会比二分类诊断试验复杂得多，这方面有待进一步挖掘和探讨。

1．苏春娟，闵捷，刘沛，等．诊断试验证实偏倚校正方法的比较研究．中国卫生统计，2007，24(2):143-145．

2．Pennello GA．Bayesian analysis of diagnostic test accuracy when disease state is unverifiedfor some subjects．J Biopharm Stat，2011，21(5):954-70．

3．Campbell G，Pennello G，Yue L．Missing data in the regulation of medical devices．J Biopharm Stat，2011，21(2):180-95．

4．Little RA，Rubin DB．Statistical Analysis with Missing Data(2nd edn)．Wiley:New York，2002．

5．花琳琳，施学忠，杨永利．不同缺失值填充技术在HIV/AIDS血液样品检测数据中的应用．中国卫生统计，2011，28(6):668-669，673．

6．Shi L，Campbell G，Jones WD，et al．The MicroArray Quality Control(MAQC)-II study of common practices for the development and validation of microarray-based predictive models．Nat Biotechnol，2010，28(8):827-38．

Comparison and Application of Different Methods for Analy-zing Data with Missing in Diagnostic Trials

Huang Yaohua，Tang Xinran，Wang Yang，et al．Medical Research ＆ Biometrics Center，State Key Laboratory of Cardiovascular Diseases，Fuwai Hospital National Center for Cardiovascular Diseases，Chinese A-cademy of Medical Sciences and Peking Union Medical College(100037)，Beijing

ObjectiveTo explore and compare the results of different methods for analyzing missing data in diagnostic trials.MethodsComplete case method，missing at random method，worst case method，non-informative imputation method are compared for analyzing data with missing in diagnostic trials．An example is used to compare the results with different methods，and the results are evaluated from sensitivity，specificity，positive predictive value，negative predictive value.ResultsComparing with other traditional methods，non-informative imputation method is a kind of method which is conservative and employs only an assumption.ConclusionNon-informative imputation method can conservatively estimate the real diagnostic effect when there exists missing data in diagnostic trials．

Diagnostic trial;Missing data;Non-informative Imputation

(责任编辑:郭海强)

诊断试验缺失值处理方法的比较研究及应用

方 法

1.完整数据法

2.随机缺失法

3.最差值法

4.无信息结转法

实例分析与结果

1.完整数据法

2.随机缺失法

3.最差值法

4.无信息结转法

5.四种评价方法的比较

讨 论

方法

讨论