渔业资源研究中II型错误与样本容量关系的模拟研究

2017-01-20 01:55潘艳玉王迎宾徐元凯邵裕真钱亚婷
关键词:样本容量假设检验渔业资源

潘艳玉,王迎宾,徐元凯,邵裕真,钱亚婷

(浙江海洋大学水产学院,浙江舟山 316022)

渔业资源研究中II型错误与样本容量关系的模拟研究

潘艳玉,王迎宾,徐元凯,邵裕真,钱亚婷

(浙江海洋大学水产学院,浙江舟山 316022)

在假设检验中经常会出现两类错误,即“弃真”(I型错误)和“纳伪”(II型错误)。通常研究者往往更加注重I型错误所带来的危害,却忽视II型错误的可能性,这一情况在渔业资源研究方面同样存在。本文结合国内外对II型错误的研究现状及我国渔业资源现状,模拟产生10 000个鱼类可捕体长数据作为总体,并从中随机抽取不同的样本容量,每个样本容量重复抽取200次,分别计算各个样本容量下的平均值、标准差、拒绝域以及各组犯II型错误的概率,并绘制概率密度分布图,经过分析可得在其他条件相同的情况下,II型错误概率β随着样本容量的增加而呈现一定的下降趋势。

假设检验;I型错误;II型错误;渔业资源;样本容量

随着渔业科学研究的不断发展,数理统计学中的假设检验方法已在渔业领域得到广泛应用,为推动水产业的发展起着非常重要的作用。假设检验作为数理统计学在渔业行业内最为常用的一种方法,是通过结合样本信息,利用“小概率不可能性原理”对事先作出的假设进行检验,以接受或否定原假设,从而判断样品间的实质性差异是由样品本身引起还是由不可控的因素干扰产生。

在进行假设检验时,所推断的结论并非绝对正确,所以常需要考虑到两类错误,即I型错误和II型错误,前者是指拒绝了实际上成立的原假设,即“弃真”,其概率用α表示;后者为接受实际上不成立的原假设,即“纳伪”,其概率用β表示。

国外对II型错误方面的研究早在上个世纪30年代就已经开始了[1],涉及水产研究领域中II型错误的问题研究到80年代才开始关注[2]。我国最早对假设检验中II型错误方面进行研究报道的是郭春彦[3]。1989年,郭春彦[4]发表了一篇关于对目前教育与心理统计书中I型错误及II型错误的分析,并以A地区高考语文平均成绩为例,对I型错误与II型错误概率的反比关系进行探究,文中强调了在使I型错误的概率α尽可能小的同时,一定要注意II型错误的概率β的取值。在查阅文献的同时,我们发现在各个领域显著性检验的过程中,对II型错误的分析研究非常少见,由此可见,我国对II型错误还并不重视。

经王迎宾等[3]对国内6个水产类期刊2011-2015年这5年内发表的学术论文的查阅统计,在所查阅的3829篇学术论文中,进行显著性检验的有2235篇,而分析了II型错误的文章为0篇。也就是在我国水产科学研究越来越深入的今天,大家的目光还是停留在犯I型错误概率上,而彻底忽视了犯II型错误可能会带来的后果。然而,越来越多的研究实例表明,II型错误在渔业研究领域同样具有着重要地位,对II型错误的研究能加强渔业研究的科学性,提高渔业管理的效率。

对于许多初次接触假设检验的学者来说,往往会陷入一个误区,就是认为犯I型错误的概率越小越好,也就是α的值越小越好。其实当其他条件都相同的时候,犯I型错误的概率α越小,拒绝域W的范围越小,接受域范围就相应的增大,则犯II型错误的概率β越大;相反,犯I型错误的概率α越大,拒绝域W的范围越大,接受域范围就相应的减小,则犯II型错误的概率β越小[5]。我们无法同时减小犯I型错误和II型错误的概率,也就是说犯这两类错误的概率不是相互独立,而是相互关联的。

当α的值很小的时候,原假设H0一般不会被轻易拒绝。此时如果样本落在拒绝域,那么作出的否定原假设的结论就相对比较可靠;相反的如果因为样本落在接受域而选择接受原假设的结论不一定可靠,因为这个时候犯II型错误的概率可能很大。在实际的应用中,应根据具体的情况,选取合适的α或者β,当人们不轻易拒绝H0的时候,α的值可以尽可能取小一点(最常用的是α=0.05和0.01,有时也用到0.001,0.10),β的值往往控制在0.10至0.30之间,因为在大多数假设检验中,第一类错误被认为更有害,更需要控制[6]。

可是在渔业资源研究中,有时II型错误可能带来的危害会更大。2002年美国国家科研委员会一份报告显示,渔业管理委员会在设定捕捞限额时对科学信息的忽略是引发过度捕捞的主要原因[7]。在某种程度上,科学信息是海洋渔业资源管理的关键[8],而科学信息与假设检验又有着密不可分的联系。例如,我们要研究在一定捕捞强度下某种渔业资源是否遭到破坏[3],可以作出原假设H0:在该强度下渔业资源没有显著减小和备择假设HA:在该强度下渔业资源会出现显著减小。如果原假设为真而被我们拒绝了,根据这个检验结果,我们可能会适当地减小捕捞强度以保证渔业资源可持续发展,从而犯了I型错误,这一结果会影响渔民的收入水平,但是资源得到了保护,不会受到破坏。相反,如果原假设不正确,检验结果却显示在该强度下渔业资源没有显著减小,渔业工作者根据这一结论而继续保持原有的捕捞强度,这将很有可能导致过度捕捞,资源受到破坏,由此可见,在渔业研究领域中II型错误可能会带来更大的伤害,这应该引起渔业研究者的高度重视。本文通过模拟产生总体数据,并对随机抽取不同样本容量的样本对II型错误概率β的影响展开研究。

1 材料与方法

本文所做的假设检验需要运用到的是z检验和t检验,这两种检验方法的差异主要是由于总体方差的设定不同。通常当总体方差已知的时候,采用z检验,运用公式当总体方差未知的时候,采用t检验,这时需要运用到公式计算。这两种检验统计量源出同根,只是在总体方差处理上有所不同,导致了检验方法的差异,实际上这两种检验的绝对差异并不明显[9],均适用于本文的模拟研究。

由前文可知,II型错误概率β并非一成不变,而是和α有着密切关系,其他条件相同的情况下,α越大,β越小,反之,α越小,β越大。除此之外它还受到其他因素变化的影响,例如与真实值μ有关,用α来表示样本检测值μ0与真实值μ的差异,根据其相对距离(μ-μ0)/σ在其他条件相同时,其值越大则表明μ与μ0的差距越显著,犯II型错误概率β越小[10];此外,β值与样本容量n也有着密不可分的关系。

本文以探究某种鱼类种群是否面临过度捕捞的危险为例,假设该鱼类种群平均体长在150 mm及以上则表明属于合理开发状态即没有面临过度捕捞,若平均体长小于150 mm则已过度捕捞,需要重新控制捕捞强度以保护鱼类资源可持续。

为了探究样本容量n对β值的影响,我们利用电子表格软件Excel进行统计分析,模拟某种鱼类种群体长数据。假设该鱼类资源可捕体长一般在100~200 mm,利用RAND函数随机产生了10 000个体长数据,求得这个总体的平均体长为149.616 mm,总体标准差为28.78,在显著性水平α=0.05条件下,拒绝域也就是说体长平均数大于149.527 mm,就应接受原假设。但是当原假设不正确的时候,将会导致II型错误发生。其概率求算为即II型错误发生的概率为62.19%,也就是我们此次模拟的真实值为62.19%。

利用INDEX函数从已经模拟出的10 000个数据中随机取数,样本容量分别为100、200、300、400、500、600、700、800、900、1000这10种情况,每种样本容量各重复取样200次,分别计算其样本平均值、样本标准差、拒绝域(分总体标准差已知和未知两种)以及犯II型错误的概率β,根据已经求得的概率,运用NORMDIST函数求出其正态分布函数并结合概率画出概率密度正态分布图。

2 结果

当总体平均数和总体方差均已知时,采用z检验来处理数据,探究样本容量与β的关系,通过在各样本容量条件下拒绝域取值的变化对比观察,不难发现,随着样本容量的增大,拒绝域xα的值也在不断增大,但并不是像一次函数那样无限增长,而是不断趋近于总体的拒绝域约为149.53 mm(图1)。

图1 拒绝域与样本容量的关系Fig.1 Relationship between rejection region and sample size

以每个样本容量下每组的样本标准差作为数据源,计算其波动离散程度即标准差,观察表1,我们可以明显的发现,当样本容量较小的时候,各个样本标准差的波动较大,不稳定。但是随着样本容量的增大,样本标准差逐渐趋向稳定。

表1 样本标准差与样本容量的关系Tab.1 Relationship between sample standard deviation and sample size

根据II型错误概率β的概率密度分布图(图2)可知在其他情况都相同的时候,样本容量不断增加的同时犯II型错误的概率有一定的减小的趋势,且不断的靠近真实值62.19%。

图2为在总体标准差已知,即总体标准差为28.78时所得到的II型错误概率密度分布图,图中直线为真实值62.19%,曲线部分由上至下分别是样本容量为100、300、400、200、500、600、800、700、900、1000时的概率密度曲线,考虑到随机取样可能造成一定的误差,所以我们得出,在控制其他条件相同的情况下,随着样本容量的增加,II型错误的概率有所减小。并且,对各个样本容量下概率的峰值统计(表2),结合图2,我们可以发现,随着样本容量的不断增加,概率峰值有所下降,II型错误的概率不断接近已知真实值。

图2 概率密度正态分布图(已知总体标准差)Fig.2 Probability density distribution plot (totally standard deviation is known)

表2 概率峰值与样本容量的关系Tab.2 Relationship between the probability of the peak and sample size

以上是模拟假设总体标准差已知的情况,但是在解决实际问题的时候,我们往往不知道总体标准差,这时就需要运用单样本t检验进行检验,利用样本标准差进行求算。通过对未知总体标准差时的拒绝域与已知情况时拒绝域的对比(表3),不难发现不管是已知还是未知总体标准差,拒绝域随着样本总量的增大而不断接近总体拒绝域149.53 mm。当样本容量较少时,拒绝域的波动范围较大,随着样本容量的增大,拒绝域逐渐稳定趋近于总体拒绝域。

表3 两种情况下拒绝域与样本容量的关系Tab.3 Relationship between rejection region and sample size in two cases

图3是在总体标准差未知时,利用样本标准差求得的II型错误概率β的概率密度分布图。根据其变化趋势,不难发现利用样本标准差进行计算出的概率β总体也是随着样本容量的增大呈现一个下降的趋势且不断接近真实值。

图3 概率密度正态分布图(未知总体标准差)Fig.3 Probability density distribution plot(when totally standard deviations unknown)

图3中直线为真实值62.19%,曲线部分由上至下分别是样本容量为 100、300、400、200、500、600、800、700、900、1000时的概率密度分布曲线。由于是用样本标准差进行求算的,所以个别较用总体标准差的结果略有偏差,但是仔细观察可以发现,它们之间的差距其实很小。其实相比总体标准差而言,利用样本标准差更符合实际。

3 讨论

如今,在多种研究领域中,大多都有涉及到显著性检测这一统计检测方法。而据大量文献资料查阅可知,在国外渔业资源领域中II型错误方面的研究最早是从上个世纪80年代开始的,而我国在这方面却少有研究。特别在渔业资源评估中,假设检验占据重要地位,II型错误也应该引起广大学者的关注。在实际应用中,根据实际情况需要,选取合适的样本容量来控制II型错误发生的潜在危害将会有利于渔业生产和渔获结构的改进,对提高我国渔业管理的科学性、尽快实现渔业资源的恢复具有积极意义。

本文通过模拟研究II型错误概率与样本容量的关系,发现样本容量的选择在统计推断中至关重要。当我们选取了合适的α来控制好I型错误的概率,其他条件一定时,样本容量的选择将会直接影响到II型错误的概率。由于实际中样本容量通常自由选择,因此往往无法做到控制概率β,也无法保证统计假设检验效果[11]。本文模拟工作得出犯II型错误的概率β随着样本容量的增大而有一定的减小趋势这一结果,增加样本容量n,是同时减小两类错误的必要条件[12],也就是说,在之后的假设检验的时候,我们可以适当的增大样本容量使II型错误的概率控制在一定的范围内。

然而样本容量并非越大越好,在实际的渔业资源研究中,样本容量的增大,势必会造成实际操作成本的增加。例如我们想要了解一种鱼类种群是否面临过度捕捞危险,若想要控制一个很低的β而选择一个很大样本容量,则将需要捕捞大量该鱼类种群,这必将增大渔业工作者的工作量,延长工作时间,且其操作成本也会有所提高。其最终的检验效果可能只是略高于一个较小的样本容量,考虑到实际操作成本费用和实际情况,有时我们会选择一个相对较合适的样本容量进行检验,而不是越大越好。

4 结语

本文存在的不足是没有继续探究如何去选取一个具有实际操作性和适应性的样本容量。在假设检验应用越来越广泛的今天,II型错误也应逐渐被重视起来,本文通过模拟研究浅谈了II型错误与样本容量的关系,我们大致得出在其他条件都相同的情况下,犯II型错误的概率β随着样本容量的增大而有一定的减小趋势,同时随着样本容量的增大概率β不断接近真实值。在渔业资源研究领域中,若这一结论被更多的工作者,管理者关注的话,相信将更加有助于准确揭示捕捞作用对群落结构和生态系统的影响机制。

[1]TANGP C.The power function of the analysis of variance tests with tables and applications of their use[J].Statistical Research Memoirs,1938,2(2):126-149.

[2]PETERMAN R M,ROUTLEDGE R D.Experimental management of Oregon coho salmon(Oncorhynchus kisutch):designing for yield of information[J].Canadian Journal of Fisheries and Aquatic Sciences,1983,40(5):1 212-1 223.

[3]王迎宾,俞存根,陈 勇.水产科学研究中被忽视的II型错误[J].水产学报,2016,40(1):135-143.

[4]郭春彦.对目前教育与心理统计书中I型及II型错误的分析[J].北京师范学院学报:自然科学版,1989,10(2):57-64.

[5]苏再兴,王志福,管 杰,等.假设检验中两类错误及其关系的探讨[J].科技信息,2010(35):117-233.

[6]孙成霖.浅谈假设检验中的两类错误及样本含量的关系[J].价值工程,2010,29(6):39.

[7]韩 勇.美国渔业资源的管理和保护[J].海洋开发与管理,2006,23(3):91-92.

[8]诸晓琳.预警原则在中国海洋渔业资源管理中的适用[J].海洋通报,2010,29(3):289-294.

[9]智冬晓,许晓娟,张皓博.z检验与t检验方法的比较[J].统计与决策,2014(20):31-34.

[10]甘伦知.假设检验中控制第二类错误的探讨[J].统计与决策,2011(22):35-37.

[11]励晶晶,郭 文.两类错误条件下的样本容量选择[J].统计与决策,2010(15):14-18.

[12]苏新富.假设检验的错误分析[J].辽宁师专学报,2012,14(2):7-8.

Simulation Studies of the Relationship between Type II Error and Sample Size in the Researches of Fishery Resources

PAN Yan-yu,WANG Ying-bin,XU Yuan-kai,etal
(Fishery School of Zhejiang Ocean University,Zhoushan 316022,China)

Two types of mistakes often appear in hypothesis testing,namely the"reject a true null hypothesis"(type I error),and"accept a false null hypothesis"(type II error).In a general inspection,researchers usually pay more attention to the damage which caused by type I error,and ignore the possibility of type II errors. This situation also exists in the fishery resources research.Based on the domestic and foreign researches of type II errors and the present situation of fishery resources in China,we simulated 10 000 data,and then from which we randomly drew different samples with different sample sizes.For each sample size,we repeated the simulation process 200 times.Sample means,standard deviations,rejection region and the probability of type II errors of different sample sizes were calculated,and the figures of probability density distributions were drawn. The results showed that when other conditions were the same,the probability of type II error β showed de-creasing trend with the increase of sample size.

Hypothesis test;type I error;type II error;fishery resources;sample size

S91

A

1008-830X(2016)05-0425-05

2016-07-10

国家自然科学基金(31270527);浙江省公益性技术应用研究计划项目(2015C33094);浙江省自然科学基金(LY13D010005);浙江省本科院校中青年学科带头人学术攀登项目(Pd2013222);2015年浙江海洋学院大学生科技创新项目(xj201508)

潘艳玉(1994-),女,浙江青田人,研究方向:海洋资源与环境.E-mail:18368095282@163.com

王迎宾(1979-),博士,教授,研究方向:渔业资源与种群动力学.E-mail:yingbinwang@126.com

猜你喜欢
样本容量假设检验渔业资源
沅江怀化段渔业资源增殖保护措施
采用无核密度仪检测压实度的样本容量确定方法
假设检验结果的对立性分析
东海渔业资源重建的智慧技术思考
中韩渔业资源联合增殖放流活动在青岛举行
简述鱇浪白鱼渔业资源相关研究成果、问题与建议
蒙特卡罗模拟在计量经济学中的应用
分层抽样技术在课堂满意度调查中的应用研究
统计推断的研究
凤爪重量质量管理报告