“生态学实验‘伪重复’”“真”“假”之辩

2013-04-06 20:26林祥磊肖显静
关键词:独立性尺度论文

林祥磊,肖显静

(中国科学院大学 人文学院,北京100049)

一 问题的提出及研究策略的确定

“生态学实验‘伪重复’(pseudoreplication)”这一概念,是美国生态学家赫尔伯特(Hurlbert S H)1984年发表的“伪重复和生态学野外实验的设计”论文中提出的。在该文中,他首先区分了测量实验(mensurative experiments)和操纵实验(manipulative experiments)这两类生态学野外实验;然后介绍了操纵实验设计中若干关键性术语,如处理、对照、重复、随机化和穿插分散等;在此基础上,提出生态学野外实验穿插分散方式的各种类型并对此加以分析,给出“伪重复”的定义,得出“不能保证统计独立性的‘穿插分散’是导致‘伪重复’的重要原因”这一结论;分析了1960-1980年发表于生态学杂志上的176个实验,发现在使用统计检验的文章之中有48%存在“伪重复”;对“伪重复”进行了分类,得到了3种最常见的类型——“简单伪重复”(simple pseudoreplication)、“时间伪重复”(temporal pseudoreplication)和“牺牲的伪重复”(sacrificial pseudoreplication),并指出,在这些“伪重复”中,虽然进行了推断统计以检验处理效果,但是数据所源自的实验没有重复——尽管可能存在多个抽样(samples)——或者重复不独立;最后,针对统计学家和期刊编辑等提出了相关建议。[1]

赫尔伯特的论文发表后,引起了美国乃至国际生态学界的高度关注,影响很大。文章发表当年,赫尔伯特就获得美国统计学会(American Statistical Association,ASA)的斯内德克奖(George W.Snedecor)①Snedecor Award:Past Award Recipients.http://nisla05.niss.org/copss/PastAwardsSnedecor.pdf(2013 年02 月07 日进入该网站),并且于1986年获得了美国自然科学基金会(NSF)9万余美元($90005)的资助,以支持他进一步进行生态学研究中统计学方法论的评价②Award Abstract#8509535:Evaluation of Statistical Methodology in Ecological Research.http://www.nsf.gov/awardsearch/showAward.do?AwardNumber=8509535(2013年02月07日进入该网站)。2003年,在美国科学院第140次年会上,他还获得了“科学评论”奖(NAS Award for Scientific Reviewing)③NASAward for Scientific Reviewing.http://www.nasonline.org/about-nas/awards/scientific-reviewing.html(2013 年 02 月07日进入该网站)。根据Thomson ISI的统计,赫尔伯特的这篇文章的被引频次为4 081次④2013年02月07日在THOMSON ISI公司的Web of Science数据库的查询结果。,而Google Scholar上显示,赫尔伯特这篇论文的引用率已达5 421次⑤2012年02月07日在Google搜索引擎的查询结果。。

赫尔伯特所发表的这篇文献为何有如此大的影响呢?究其原因主要还在于,赫尔伯特在该文中首次提出了“生态学实验‘伪重复’”的概念,揭示了“生态学实验‘伪重复’”是一普遍现象,并认为这种现象对于生态学研究是有害的。

赫尔伯特的观点得到很多生态学家的赞同,但是也遭到少数生态学家的批判。霍金斯(Hawkins,C P.)1986年发表了一篇简短的评论,认为,有力的生态学推理有时候是从处理没有被重复的实验中得出的;这样的实验尽管会被认为是“伪重复”而受到批评,但有时仍能产生强的生态学证据。他担心,对“伪重复”问题的过激反应是有害的,如那些对“伪重复”“伪理解”的审稿人,会将所有的非重复(nonreplication)研究判定为“伪重复”的和科学上不充分的。[2]哈格罗夫等(Hargrove et al)在 1992 年发表的论文中认为,对于大尺度生态学,如景观生态学,由于其对象具有整体性,对此重复常常是无法进行的,甚至为了获得对对象本身的认识,也不必或不需要去重复。如果此时硬性地实施比较完全的重复,则很可能对对象本身实施了还原性的处理,而则是与对象的整体性不符合,从而也是不恰当的。进行有限的重复,即“伪重复”,就可能无法避免了。这比没有重复要好。他甚至声称,“伪重复”是景观生态学的必要条件。[3]

从他们的批判看,他们并不否定“伪重复”这一概念,而只是表明应该有策略地对待“伪重复”,而且,他们的批判没有受到人们更多的关注。

到了21世纪后,情况有所不同,出现了几位重要的对赫尔伯特“生态学实验‘伪重复’”的批判者,如瑞典学者奥克萨宁(Lauri Oksanen,2001)、俄罗斯学者塔塔尼科夫(Tatarnikov D V,2005)、美国学者斯申克等(Schank J C et al,2009)等,他们中的一些人甚至认为,“生态学实验‘伪重复’是一个‘假问题’”(pseudoissue)。这遭到包括赫尔伯特等人的反驳,他们认为,“生态学实验‘伪重复’仍然是一个‘真问题’”,由此引发“生态学实验‘伪重复’究竟是一个‘真问题’还是‘假问题’”的争论。

谁是谁非?本文结合生态学的具体案例,在系统分析上述有关争论的基础上,明确“生态学实验‘伪重复’”的内涵,给出恰当的结论。

二 奥克萨宁的批判及考特尼等对其的反驳

(一)奥克萨宁对赫尔伯特“生态学实验‘伪重复’”的批判

1.“非重复实验”可能是更好的选择。

奥克萨宁认为,对于生态学来说,其最终目标是理解生命所依赖的大尺度生态系统的动力学,从而为自然资源的可持续利用以及生物多样性保护等提供科学基础。在这些系统中,有些重要的问题可以在有限的空间和时间中处理,有些则做不到。[4]28对于后者,奥克萨宁认为有4种方案来解决这一问题:第1种方案是利用微宇宙实验(microcosms)来模拟大尺度系统;第2种方案是关注大尺度系统中的短暂动态;第3种方案是在实验中设置对照的重复,而不设置处理的重复;第4种方案是进行“非重复实验”,其中,实验者要么避免使用推论统计(4a),要么关注处理和对照之间的空间差异使用了推论统计,从而进行了“伪重复”实验(4b)。[8]28

不过,奥克萨宁认为上述前3种方案具有局限性:第一种方案仅仅是一个初步的过程,由于是在模拟自然条件下得到的结果,还需要在真实的条件下进一步实验;第二种方案仅仅是对短暂动态的研究,结果的可信度不高,因为如果从更长的时间尺度来看,结果会不同;第三种方案没有设置处理的重复,往往无法区分无关因素的干扰。[8]28-32

在这种情况下,奥克萨宁倾向于第四种选择。他认为,试图设置重复设计,在大的空间和时间尺度上进行实验,是极其昂贵的,而如果将经费更多地分配到“非重复实验”(无论是称之为“伪重复”还是其他什么东西)上,则有可能比设置了重复的实验提供更多的信息,研究也会总体上获得更多进步,并且还可以利用元分析(meta-analyses)弥补研究结果的精确性。[8]32他进一步认为,对于那种合理检验涉及大尺度系统的预测的方法,即在大尺度系统上进行非重复实验,并进行统计检验,是允许的,赫尔伯特将此称为“伪重复”,是毫无根据的污蔑。[8]27

2.不应当反对在“生态学‘非重复实验’”中使用推论统计。

奥克萨宁对赫尔伯特所提出的“生态学实验‘伪重复’”的批评,重点还放在“非重复实验”中是否使用了推论统计,这主要针对上面所指的4(b),给出了相应观点。

(1)如果以此来认定生态学实验,则“伪重复”太多了。奥克萨宁认为,赫尔伯特之所以有上述看法,是因为他没有深刻了解描述性研究,在这些研究中,仍然存在大量对空间和时间差异的统计检验。如果在赫尔伯特所谓的“生态学实验‘伪重复’”中这也算错误,那么这些“错误”在1950-1990年期间①在奥克萨宁2001年的论文中(Oksanen 2001,p31),对“Ives et al.1996”的文献引用有误,奥克萨宁将该文献发表年误认为“1966”,将该文献对“描述性研究”统计的时间段误为“1985-1995”(实际为“1950-1990”),并且后面的比例估算为“约20%”是不准确的,应为约25%。就被广泛接受了,并在3个最有影响力的生态学期刊上(Ecology,The American Naturalists,Journal of Animal Ecology)发表了大量此类的文章,比例稳定在约 25% 。[5]682

(2)生态学实验中“推论统计”的作用有很多。赫尔伯特认为,在“生态学‘伪重复实验’”中使用推论统计是错误的,因为没有重复,统计学只能告诉我们自然界在空间上的差异,实际上这不用说我们也是知道的。[8]31奥克萨宁提出,当讨论使用和滥用推论统计学时,赫尔伯特忘记了,“推论统计学并非仅仅只是回答统计总体是否能被看做不同”这一问题,它也允许我们评价两种统计总体上至少有多大程度的不同、它们的时间格局是否不同以及许多其他方面;如果不使用推论统计学,那么在对数据集的非统计表述中,作者仅仅呈现出他的样本,就要求读者盲目相信样本中的格局代表了采样的统计总体中的格局,这样对读者来说是粗鲁和无礼的。[8]31

(3)在某些情况下,只能使用“推论统计学”。按照赫尔伯特的判断,方案4(b)的实施就是在进行“非重复实验”的同时,使用了推论统计,他将其称为“生态学实验‘伪重复’”,在他看来在这种情况下不能使用推论统计。[8]32不过,奥克萨宁不同意这种观点,他通过一个概率统计的公式对此进行了反驳,认为在这种情况下只能借助于推论统计。[8]32

3.根据“混合处理”,认定所有的生态学实验是否为“伪重复”,有失偏颇。

奥克萨宁将“表2中B-4物理上相互依赖的重复”[1]193这种实验设计称为“混合处理”。他认为,“混合处理”的本质是,意外的副效应导致了处理与对照之间统计上的显著性差异,这在所有的实验中都存在这样的问题,而且,即使实验者意识到了,也不可能消除那些副效应。[8]31-32一个经典例子是,捕食者排除实验固有的“栅栏效应”(fence effect),即当排除捕食者的时候,也会阻止被捕食者的移动,这可能具有种群动态的结果,因此,如果“伪重复”概念在一个更宽的意义上使用,包括混合处理,那么所有的实验都是“伪重复”的。况且,在应用性研究中,“伪重复”就不是一个问题,因为实验的最终结果是确立处理和结果之间的统计关联。实验者所要问的问题是:给定处理(例如,农田和森林的施肥、人的医疗)多大程度上帮助获得一个社会的目标(较大的作物、更健康的人)?这一问题可以通过重复做实验的方式处理,因为实验的主要兴趣是统计关联本身,因果解释是次要的。[8]33

4.对于演绎性生态学实验,用“伪重复”来认定并不合理。

奥克萨宁认为,生态学实验分为两类:一类是归纳性实验,即本着归纳的精神实施的实验;一类是演绎性实验,即本着演绎精神实施的实验。归纳和演绎这两种进路在科学中都有其作用:归纳性实验能够提供新的意想不到的洞见,用进化与之相类比,此类实验可以被看做是各种有利变异的滋生地;而对于演绎预测性的实验检验则反过来加强了猜想与研究纲领之间的生存斗争,提高了最适者生存的可能性。对于归纳性实验,基于归纳逻辑要求重复,但基于演绎性实验,是基于演绎逻辑的,“游戏规则”是完全不同的,重复并非实验设计的必要部分。[8]36奥克萨宁认为,赫尔伯特没有区分上述两点,秉持归纳主义的原则,基于归纳逻辑的重复要求,从而把有关归纳主义的战术上的使用当成了战略上的错误,而认定一些生态学实验为“伪重复”,是在生态学中对“死去已久”的归纳主义的复活,是错误的。[8]35

(二)考特尼等对奥克萨宁的反驳

比利时学者考特尼等(Karl Cottenie and Luc De Meester)针对奥克萨宁的观点于2003年发表了一篇简短的论文,反驳了奥克萨宁的观点,申明“伪重复”不是一个“假问题”,而是一个有效的和重要的统计学问题。[6]考特尼等认为,奥克萨宁之所以反对赫尔伯特的观点,似乎部分是由于奥克萨宁混淆了混合处理,以及误认为赫尔伯特是归纳主义者;奥克萨宁所声称的“如果混合处理也是伪重复的话,那么所有的实验都是伪重复的”并不恰当;为了最大限度反映自然的情况,对于某些问题,大尺度“非重复实验”必不可少,但是,由此并不能得出“良好的重复实验不能得到正确的结论”。[10]395

在该文中,考特尼等也没有彻底否定奥克萨宁2001年的文章,他们试图调和奥克萨宁和赫尔伯特的观点。他们认为,奥克萨宁论文的价值在于强调生态学大尺度实验的重要性,即认可非重复的大尺度生态学实验的合理性。因为,奥克萨宁认为,为了避免“伪重复”而得到完美的实验设计,通常会放弃研究的尺度,虽然可能会得到比较精确的结果,但最终会远离自然的本来面目,恰当的重复和分散仅仅只是生态学实验的一个方面。这是其一,其二,在开展非重复大尺度生态学实验的背景下,可以通过元分析来实现非重复大尺度生态学实验的精确结果,而且,后期使用元分析,还有可能保证此类非重复研究的论文的合理性。这是发表大尺度生态学实验研究结果的一个重要依据,也是由于此类生态学系统的尺度特殊性和复杂性,导致这些实验本来就难以重复使然。他们认为,奥克萨宁强调大尺度非重复实验,认为它们在某些情况下能够得到正确结论,这是没问题的,但不能就此来否定重复实验,这在逻辑上讲不通。[10]396

(三)赫尔伯特对奥克萨宁的反驳

赫尔伯特2004年有针对性地反驳了奥克萨宁对“伪重复”的批判[7]。他言辞犀利,似乎奥克萨宁的批评激怒他。开篇他就说道:“如果‘伪重复’真的是一个‘假问题’,这将会震惊美国统计协会,因为该协会将最初的‘伪重复’论文评为1984年度生物统计学最佳论文,并为其颁发了斯内德克奖。”[11]591赫尔伯特认为奥克萨宁的错误主要有三点。

1.误解了“伪重复”的性质

首先,奥克萨宁说“‘伪重复’是对‘非重复’大尺度生态学实验的‘污蔑’”,是因为没有了解到“伪重复”的错误不只会在“非重复”的实验中发生,也在“重复”实验如“牺牲的伪重复”发生,只不过此时比较隐蔽。其次,奥克萨宁反对将生态学实验中的“混合处理”认定为“伪重复”,并认为如果这是“伪重复”,则所有的实验都是“伪重复”,是因为没有理解那个例子。在那一例子中,两个处理中的每个处理下都设置了多个水族箱,但是每个处理的所有水族箱都连接到同样的水循环系统,这会破坏它们的统计独立性,而且最终统计分析忽略了这一事实。[11]592进一步地,赫尔伯特举例论证道,在农业实验中,如果一个处理的所有区块都被放置在田地北端,而另一处理的所有区块都被放置在南端,则重复的区块也会缺少统计独立性。[11]592

2.错误地认为“生态学实验‘伪重复’”复活了归纳主义

首先,赫尔伯特指出,奥克萨宁在文中自相矛盾。在某一处,奥克萨宁承认“归纳和演绎两种进路在科学中都有其作用,归纳实验能够提供新的、意想不到的顿悟”。[8]35但是,在别处,奥克萨宁则采取了严格的立场,认为,“作为科学的基本方法,归纳主义(=过度依赖归纳推理?)已经死去几个世纪之久,在1984年被赫尔伯特复活真令人惊愕……它是一种完全过时的认识论”。[8]33其次,赫尔伯特认为,他在 1984 年论文中所评论的176个生态学实验中,有些实验可能是以纯粹“演绎的态度”实施的,有些实验则是以纯粹的“归纳的态度”实施的,但是大多数实验本质上是归纳和演绎混合的,科学通常既允许通过演绎的方式检验已有的猜想或理论,又允许通过归纳的方式以新的观察来获得“顿悟”的机会。赫尔伯特援引美国学者福特(David Ford)的观点来反驳奥克萨宁:“没有一个唯一的推理方法是科学家能够或一定遵守的。我们用两种普遍的方式进行推理:演绎的……归纳的……科学研究中的大多数推理都是归纳的……假说-演绎(H-D)法在范围上比经验归纳更宽,因为它从现有理论中寻求演绎结果的支持——但是,本质上,归纳方法和预测不应被视为完全独立于用来产生它们的理论的证据。”[8]他还戏谑地说,“凭良心来说,我必须将‘恢复归纳主义王子’(Prince of Inductionism Restored)的冠冕赶快传给福特”。[11]593

3.过高评价了“生态学‘非重复实验’”

赫尔伯特首先肯定了大尺度生态学实验的重要性。他认为通过操纵实验的方式,很难获得对发生在大尺度空间和时间上的生态学现象和其他自然现象的理解,因为,在大尺度上创造并使用恰当尺度的实验单元简直是不可行的。这些大尺度操纵实验通常可能会缺乏处理重复,但由于此类研究很少,并且往往会导致重大的新的洞见,确证特定理论,因此,能够推动科学进步。[11]595此外,赫尔伯特强调,在 1984年的论文中,他并没有将此类大尺度生态学实验称为“不严密的”或“伪重复的”。其次,赫尔伯特也反对过高评价“非重复实验”。他认为每一个提出的实验都必须通过其自身的目标、设计、可能性以及费用来评判,不应不加考虑地拒绝没有处理重复的实验,也不应仅仅根据它们的昂贵费用就不加考虑地拒绝具有处理重复的更有力的实验。[11]596更何况,他认为,元分析远不是一个方法论的万灵药,吃了它就能够弥补研究的缺点。当实验缺少处理重复时,对处理效应的估计包含了大量“噪声”或“随机误差”,最终元分析的结果输出也将是“嘈杂的”。[11]596

赫尔伯特最后还激动地说:“但是,让我们不要畏惧直言不讳。‘伪重复’会继续是生态学和许多其他社会科学和自然科学中最常见的统计错误之一,犯这种错误与演绎和归纳的推理方式无关。熟悉最常见类型的‘伪重复’(简单伪重复、时间伪重复和牺牲的伪重复)的科学家将会发现,避免它们很容易。不熟悉它们的编辑和评阅人则将会继续错误地判断论文稿件,并滋长期刊中的混乱。”[11]596

三 塔塔尼科夫的批判及科兹洛夫等的反驳

(一)科兹洛夫的评论

科兹洛夫(Kozlov M V)2003年发表了一篇文献。该文献通过调查指出,自从赫尔伯特1984年发现“生态学实验‘伪重复’”之后,由于未知的原因,这一问题被俄罗斯科学家完全忽视了,导致的结果是,自从1998-2001年,在俄罗斯6份生态学专业杂志中,有超过21%的实验生态学论文是“伪重复”。不仅如此,这篇论文还通过几个来自俄罗斯生态学家的案例分析,简要地评价了“伪重复”发生的情形以及实验设计的某些方面。[9]

(二)塔塔尼科夫的批判

塔塔尼科夫(Tatarnikov D V)2005年发表了一篇针对科兹洛夫论文的评论。他认为,科兹洛夫的论文中有3种被列为简单伪重复的情况是有效的。他认为,实验和对照试验区没有随机分布会被看做是错误的,因为实验结果可能会受到空间异质性的干扰。但是,在这种情况下却没有伪重复,因为生态学系统的变异性是因不同地区而不同的因素所产生的,并且每个生物都会对这些因素做出单独响应,伪重复应该是对单个生物的响应进行多重判断而产生的。[10]

(三)科兹洛夫等的反驳

科兹洛夫和赫尔伯特(Kozlov M V and Hurlbert SH)于2006年针对塔塔尼科夫的批评进行了反驳。[11]

首先,科兹洛夫和赫尔伯特认为,科兹洛夫识别出的3种简单“伪重复”是有效的,不过,塔塔尼科夫的评论是不恰当的,因为缺乏充分的文献基础,没有详细阅读关于“伪重复”问题的相关文献。科兹洛夫和赫尔伯特认为,可以用一个古老的俄罗斯笑话来描述塔塔尼科夫论文中的基本思想:如果某些事情是被禁止的,但是我们又非常想要它——那么它就被允许了!在某些背景下这种做法可能是有用的,但是在科学中这一做法是危险的,除非俄罗斯生态学家们声称,俄罗斯科学与某些政治家一样,有其自己的规则。其次,科兹洛夫和赫尔伯特认为,塔塔尼科夫对“实验单元”概念界定不明确,由此澄清了实验单元这一概念,并与评价单元相区分。其中,“实验单元”是“实验材料的最小系统或单元,实验者对它分配单一的处理(或处理组合),并且独立于实验中其他实验单元”,“评价单元”是“实验单元的要素,能够根据这些要素进行单一的测量”。[12]而且,赫尔伯特在1984年提出“伪重复”概念之后,就曾针对这一问题进一步精炼,认为“生态学实验‘伪重复’”“代表了对实验单元和评价单元的混淆”,[4]129并将“伪重复”广泛定义为“对每个实验单元中的多个评价单元进行的测量,或对单个评价单元进行的多次测量,在统计上被看做代表了独立的实验单元……”[13]

科兹洛夫和赫尔伯特还举了用水族箱进行的鱼类实验的例子进行说明。[15]5塔塔尼科夫认为,实验单元是其中的每条鱼,而科兹洛夫和赫尔伯特认为,塔塔尼科夫是错误的,实验单元应该是一个水族箱及其所包含的所有鱼,因为同一水族箱中两条鱼在生理上、行为上等相互作用并彼此影响,对它们的测量在统计上是不独立的,单独的每条鱼是评价单元而非实验单元。塔塔尼科夫的错误在于没有区分实验单元和评价单元,以及二者对于统计独立性和统计分析的不同含义,因此才误解了“伪重复”的含义,认为只有对单个评价单元,如水族箱中的一条鱼等进行多个测量,并将其看作统计上是独立的,才会导致伪重复。实际上,不管是对一个还是若干不同评价单元进行的测量,也不管它们是否基本上在同一时间或在一定时间间隔上进行的测量,只要对同一实验单元进行了多个测量,并把多个测量看成是统计独立的,都会产生“伪重复”。

四 斯申克等的批判及弗里伯格等的反驳

(一)斯申克等的批判

美国学者斯申克等2009年发表论文,批评了赫尔伯特1984年论文中提出的各种“伪重复”及其相关观点,并提出了自己的看法。

1.否定反复测量分析方法的应用是不合理的

斯申克等暗示,赫尔伯特否定采用反复测量方法的研究理由是,如果“基于来自同一动物的反复测量是独立的”错了,那么我们完全同意,如果“基于反复测量可能在时间上相关联使得它们不能在统计分析中使用”,那么我们就不同意了,因为,反复测量分析通常是有效的。从赫尔伯特1984年的讨论来看不明显,但如果赫尔伯特真的否认了反复测量分析,这一观点可能起源于另外一种观点,即物理条件无论是从空间上还是时间上都无法被充分控制。[14]422

2.新的统计分析方法将解决“生态学实验‘伪重复’”问题

涉及生物的实验通常涉及多个水平的分析单元:动物个体;对动物行为的反复采样、嵌套于区块、围栏或房间的生物;嵌套于实验室或野外地点的区块、围栏或房间;嵌套于区域中的实验室或野外地点等等。沿着水平向上,会得到无限的许多更高水平(例如,房间之上是建筑物、区域实验室,甚至全世界的实验室)。斯申克等认为,有两个重要的原则是:第一,我们能够尽可能地控制较低水平的物理环境,如房间,如果成功控制了,就没有必要分析较高水平的单元,如果失败了,则能够通过统计推理模型检测到控制的失败,其中,统计推理模型解释了在这些水平上的可能相关性;第二,依赖实验内部和实验之间的重复,如果要检测的效应真的被混淆了,并且在局部检测不出来,则其他研究者就无法重复这些结果。

但是,这些问题已经有了相应的解决办法,如在社会学和教育学研究领域,随着多水平方法差分析(multilevel ANOVA)和等级线性模型(Hierarchical linear modeling,HLM)的出现,“分析单元”问题已经基本消失了。因此,在生态学中仍然坚持“伪重复”这一信条是令人惊讶的,这可能是缺少统计推理的学术训练的结果。[18]423

3.不能仅仅依靠空间关系、边界或物理关联性来确定实验单元

对于赫尔伯特来说,单个生物在实验中不具有实验单元的地位,实验单元是通过空间时间临近性、物理相关性以及物理边界所决定的。例如,研究水族箱中鱼的实验,应当将水族箱(无论其尺寸多大)看作是实验单元,而不是水族箱中的鱼,原因是由于水族箱形成了一个紧密的空间临近(proximity)条件,通过相关的各部分(即鱼)形成了一个单独的实体。[19]423这种实验单元的识别方式,就是赫尔伯特将表2中设计类型B看做是伪重复的,并且它们最终都还原到了B-5,并认为“此类实验设计本质上就是无效的”的原因。[1]193斯申克等认为,在实验设计B-1中,处理的重复空间上彼此相邻,对照的重复也是如此,此外,一个处理的重复与一个对照的重复相邻,因此,重复虽然空间上是隔离的,但是处理重复和对照重复之间却并没有清晰的界限;在B-2中,重复在空间上明显是聚集的,对于赫尔伯特来说,它们只形成了一个实验单元和一个对照单元;在B-3中,实验重复只形成了一个单元,因为它们在同一个隔离室或房间内;在B-4中,重复再一次形成了一个单元,因为在重复之间有一些物理关联,尽管它们空间上是不相邻的。[18]423

斯申克等进一步认为,实验单元是实验背景下将处理或操纵应用于其上的东西。不可否认,在实验设计中,实验单元的空间排列通常是一个重要问题,但根据空间关系、边界或物理关联性,随意将各种实体捆绑成实验单元是不正确的。[18]423

4.“合并数据”并不必然减弱统计的有效性

赫尔伯特认为“合并数据”会导致“牺牲的伪重复”,斯申克等则认为,要不要“合并数据”在于分析的潜在实验单元是否在统计上对观察到的效应有贡献,如果它们没有,则将他们合并到一个更精确的水平来估算误差将会更好,甚至有时候“合并数据”会增强统计检验的效力。[18]425

5.“时空隔离”、“穿插分散”与统计独立性并非必然关联。

赫尔伯特认为,实验单元的统计独立性是通过处理的穿插分散得到的,这显示,统计独立性依赖于处理在空间和时间上的穿插分散,穿插分散的处理越少,它们在统计上越相关(不独立),这是由于它们在空间和时间上相临近导致的。

斯申克等认为,赫尔伯特的“生态学实验‘伪重复’”核心在于空间时间上的临近可能会扰乱分析,虽然这是合理的,但是,在生态学研究中,某种程度的空间和时间重叠却总是必要的;“伪重复”的问题在于,收集的数据具有某种程度的空间和时间临近性,是否就意味着其关联以及统计上的相互依赖太过于相关,从而使得无法进行统计推理。[18]429

斯申克等进一步认为,“伪重复”存在一个固有矛盾:空间临近性会导致统计上的不独立,而对于表1中的实验设计B,以赫尔伯特的观点来看,由于处理单元之间彼此紧邻,但却与对照单元远离,因此空间和时间上的隔离并没有使得处理具有统计独立性,因此,在临近和隔离的情况下都会存在统计上的不独立性。在这种情况下,似乎只有穿插分散是保证统计独立性的方式,但是,如果穿插分散将实验单元和对照单元放置的空间上紧密相邻,按照上述逻辑也会导致实验单元和对照单元之间的统计相关性,从而统计上也不独立,这样一来隔离也是罪过,穿插分散实验单元和对照单元也是罪过。[18]429

斯申克等认为,如果我们认识到“统计独立性”与“临近性”或“隔离”在数学上是无关的,就解决这一“伪重复”的固有矛盾了。“统计独立性”仅指“两个事件中,一个事件的发生不会影响另一事件的发生概率”。很多因素会影响统计独立性,如空间和时间的临近性,但是这些因素不应与统计独立性的定义相混淆,赫尔伯特误解了“统计独立性”。[18]429

斯申克对赫尔伯特“生态学实验‘伪重复’”的批判是不遗余力的,他认为:很少有方法论信条与“伪重复”一样有如此大的影响,但是对其进行批判分析的却很少;“伪重复”背后的核心思想是对统计独立性和统计推论背景的误解;不应当将“伪重复”作为普遍标准来接受或拒绝一项实验研究,所有的研究都应当根据其自身价值来评判。一句话,“生态学实验‘伪重复’”就是一个“假问题”。[18]432

2.弗里伯格等对斯申克等的反驳

美国学者弗里伯格等(Todd M Freeberg et al)在2009年发表了论文反驳了斯申克等,认为,斯申克等曲解了赫尔伯特的原始论文,“伪重复”不是一个“假问题”,它仍然是一个问题。[15]

第一,弗里伯格等指出,赫尔伯特仅仅陈述了“这些实验设计缺乏充分的穿插分散处理以保证独立的重复”,并没有认定“此类实验设计本质上就是无效的”,这样一来,斯申克等认为,赫尔伯特在1984年描述了一个“有缺陷的方法论信条”,针对表2中的 B1 -B5,[1]193认为“此类实验设计本质上就是无效的”,就是不恰当的。[19]422第二,斯申克等认为赫尔伯特坚持否定反复测量方法的应用,对此,弗里伯格等指出,“赫尔伯特并没有否定采用反复测量方法的研究。”[19]450第三,斯申克等认为,根据赫尔伯特的观点,“显然应该避免对环境条件的物理控制,”[18]427并且,“似乎否认对于控制可能的干扰变量,对环境进行物理控制的重要性,”[18]427这是一个错误,因为不控制环境变量会导致混淆并增加变异性,控制环境变量是至关重要的。但是,弗里伯格等指出,“并没有发现赫尔伯特有这样的观点。”[19]450第四,斯申克等认为,“空间和时间临近也意味着统计的非独立性。”[18]429弗里伯格等指出,实际上,赫尔伯特认为空间和时间临近将会增加统计非独立性的可能,当然,这与临近性导致非独立性并不是一回事。[19]450第五,弗里伯格等指出,赫尔伯特在1984年发表那篇论文时,尚没有复杂的多水平统计分析,正如斯申克等认识到的,目前已经有若干有利的统计技术来解决赫尔伯特的某些问题了,这些技术包括等级线性模型和结构方程模型(structural equation modeling)等,尽管如此,将不该有的混淆降低到最少,并将数据点(data points)的统计独立性增强到最大,还是非常重要的。[19]450

五 简要的总结和评价

从上述“生态学实验‘伪重复’”的争论中看出,对“伪重复”进行批判的人们存在以下欠缺。

(一)对相关概念并没有准确地理解

这集中在奥克萨宁和塔塔尼科夫身上,如奥克萨宁混淆了“混合处理”、误解了“伪重复”的含义等,而塔塔尼科夫则误读了“实验单元”、“评价单元”等。“伪重复”可以说是在不同的情况下,将对一个实验单元的多个测量看做是多个独立的实验单元,并进行了推论统计的分析。换言之,“真重复”是对处理的重复,也就是同一处理下设置多个独立的实验单元,并且在统计分析中要使用来自各个重复的数据进行分析。对于赫尔伯特“伪重复”的内涵,需要注意两个必要条件:第一,没有设置处理的独立的重复(或者尽管设置了,但后期处理数据的时候又被忽略了);第二,进行了推论统计分析。因此,有些反对意见中认为只要没有设置重复就是“伪重复”的,是错误的,这是因为他们没有注意到第二个必要条件——有无进行推论统计分析,如果没有,仅仅是进行了描述性的分析,则不构成“伪重复”。这样一来,赫尔伯特“伪重复”实际上并没有彻底否定生态学的大尺度“非重复实验”,而是反对既没有设置重复,又在进行统计推论分析这样的做法。

(二)把不是赫尔伯特的观点认作其观点

这主要集中在斯申克身上,如他认为赫尔伯特持有“此类实验本质上就是无效的”的观点、否定“采用反复测量方法的研究”、应该避免“对环境条件的物理控制”、“时空临近会导致统计非独立性”等;另外,奥克萨宁也有类似表现,如他认为赫尔伯特是归纳主义者等。这些都是有失偏颇的。

如果分析赫尔伯特等对“生态学实验‘伪重复’”批判者的反驳,也可发现存在一定的欠缺,集中表现在只关注批判者的错误或不恰当之处,而较少聚焦于他们的正确之点并加以吸纳。实际上,批判者也提出了许多正确的或有启发性的观点,如奥克萨宁虽然错误地认定赫尔伯特是归纳主义者,但他所提出的“对于演绎性实验,用‘伪重复’来认定是不合理的”这种观点,是合理的。

总之,对于“生态学实验‘伪重复’”的争论,是必要的和有价值的,给我们诸多启发,概括起来有:应该在正确理解相关概念如“混合处理”、“实验单元”、“评价单元”、“推论统计”等概念的基础上,明确“伪重复”的定义及内涵,然后再对生态学实验进行“伪重复”的分析;“伪重复”并不只发生在“非重复实验”中,也发生在“重复性实验”中;不能因为“伪重复”而完全否定“非重复实验”,有时“非重复实验”是不可避免的,甚至是更好的选择,不能冠之以“伪重复”而硬性地否定它,而应对此保持谨慎;“伪重复”的不足可以通过其他方法,如元分析、新的统计方法等的运用加以弥补;要区分应用型实验和非应用型实验、演绎性实验和归纳性的实验,对于前者,不能一概以“伪重复”来评判它;单纯的演绎性实验和归纳性实验在生态学中都不多,更多的是它们的混合,因此,对此进行“伪重复”分析是必要的……

一句话,那些批判者所提出的“生态学实验‘伪重复’是一个‘假问题’”的判定,是错误的,但是为此判定所提出的观点和论证或者是有道理的,或者是错误的但是是有启发的。它告诉我们,“生态学实验‘伪重复’”虽然不是一个“假问题”,但是,对于其内涵以及应用却肯定是一个问题,而且是重要的问题,需要我们针对生态学实验的具体研究,加以深入的探讨,修正并完善之。“生态学实验‘伪重复’”的提出是非常具有创造性的,它的应用不但对生态学野外实验研究具有重要意义,而且对于某些学科,如医学、社会科学等也具有重要价值。

[1]Hurlbert SH.Pseudoreplication and the design of ecological field experiments[J].Ecological Monographs,1984,54(2):187-211.

[2]Hawkins,CP.Pseudo- understanding of pseudoreplication:a cautionary note[J].Bulletin of the Ecological Society of A-merica,1986,67(2):184 -185.

[3]Hargrove W W,Pickering J.Pseudoreplication:a sine qua non for regional ecology[J].Landscape Ecology,1992,6(4):251-258.

[4]Oksanen L.Logic of experiments in ecology:is pseudoreplication a pseudoissue?[J].OIKOS,2001,94(1):27 -38.

[5]Ives A R,Foufopoulos J,Klopper E D,et al.Bottle or big -scale studies:how do we do ecology?[J].Ecology,1996,77:681-685.

[6]Cottenie K,De Meester L.Comment to Oksanen(2001):reconciling Oksanen(2001)and Hurlbert(1984)[J].Oikos,2003,100:394 -396.

[7]Hurlbert SH.On misinterpretations of pseudoreplication and related matters:a reply to Oksanen[J].OIKOS 2004,104(3):591-597.

[8]Ford E D.Scientific method for ecological research[M].London:Cambridge University Press,2000.

[9]Kozlov M V.Pseudoreplication in ecological research:the problem overlooked by Russian scientists[J].Zh Obshch Biol.,2003,64(4):292 - 307.(in Russian,with English summary).

[10]Tatarnikov D V.On methodological aspects of ecological experiments(comments on M.V.Kozlov publication)[J].Zhurnal Obstchei Biologii(Journal of Fundamental Biology),2005,66:90 -93.(in Russian,with English summary).

[11]Kozlov M V,Hurlbert S H.Pseudoreplication,chatter,and the international nature of science:A response to D.V.Tatarnikov[J].Journal of Fundamental Biology(Moscow),2006,67(2):145 -152.

[12]Hurlbert S H.Pastor binocularis:now we have no excuse[review of Design of Experiments by R.Mead][J].Ecology,1990,71:1222 -1223.

[13]Hurlbert SH,Lombardi CM.Research methodology:Experimental design sampling design,statistical analysis[M].In Bekoff M M(Ed.).Encyclopedia of Animal Behavior.London:Greenwood Press,2004,2:760.

[14]Schank J C,Koehnle T J.Pseudoreplication is a pseudoproblem[J].Journal of Comparative Psychology,2009,123(4):421-433.

[15]Freeberg T M,Lucas J R.Pseudoreplication Is(Still)a Problem[J].Journal of Comparative Psychology,2009,123(4):450-451.

猜你喜欢
独立性尺度论文
财产的五大尺度和五重应对
培养幼儿独立性的有效策略
浅论我国非审计服务及对审计独立性的影响
法官自由裁量权的独立性与责任
宇宙的尺度
考虑误差非独立性的电力系统参数辨识估计
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
9