有关选修23《独立性检验》结论解释的商榷

2018-01-16 17:36王立东
中学数学杂志(高中版) 2017年6期
关键词:犯错误独立性教科书

【摘要】针对选修23《独立性检验》中有关χ2统计量计算结果解释的若干问题进行了探讨,给出一个在教学中较为恰当的解释方式,有助于学生对于独立性检验有较为全面的认识.

【关键词】χ2统计量;独立性检验;统计推断

在人民教育出版社编写的普通高中课程标准实验教科书《数学》B版选修23中的《独立性检验》一章中,对于统计检验结果的描述有若干需要商榷的地方.

1.在教科书中有如下描述(P78):

经过对χ2统计量分布的研究,已经得到了两个临界值:3.841与6.635.当根据具体的数据算出的χ2>3.841时,有95%的把握说A与B有关;当χ2>6.635时,有99%的把握说事件A与B有关.当χ2≤3.841时,认为事件A与B是无关的.

2.我们有95%(或99%)的把握说事件A与B有关,是指推断犯错误的可能性为5%(或1%),这也常常说成是“以95%(或99%)的概率”,其含义是一样的.

我们说,高中教科书中所介绍的独立性检验的思想,相当于运用统计学的知识发现,在假设事件A与B独立的前提下,所得样本的χ2>3.841的概率为5%,χ2>6.635的概率为1%,即P(χ2>6.635)|P(AB)=P(A)P(B))=0.05,P(χ2>3.841)|P(AB)=P(A)P(B))=0.01. 从而我们现有的样本χ2统计量大于临界值,则说明一个小概率事件发生了,于是我们认为,很有可能是我们的假设有误,即A,B很可能不独立. 需要注意的是,这里的5%(1%)不是我們推断犯错误的概率.

教科书提到的,所谓推断犯错误的概率,应当是对于一个χ2>3.841的样本,如果我们下一个推断:A与B不独立,那么,我们犯错误的概率(即A,B其实是独立),即P(P(AB)=P(A)P(B)|χ2>3.841|). 显然,从条件概率的角度,这与之前计算的5%或者1%是不同的.我们只能说,针对1%的情况,我们推断犯错误的概率比5%的情况要小.于是我们仅用所谓99%的把握和95%的把握来描述我们所做推断,这个并不是教科书上所提到的“概率”[1].

同时,当样本的χ2统计量小于临界值的时候,说明在独立假设的前提下,得到这种χ2值的可能性比较大,但是,这并不意味着独立假设成立的可能性大.因为,我们并不知道,在不独立的假设下,产生这种样本χ2值的概率,如果这个概率也较大,我们就不能确定是否这个样本是来自于哪种假设,此时,只能说我们没有理由,或没有足够的证据说明A,B有关,例如,教科书(P79)的描述,“应为3689<3841,我们没有理由说晕机与否跟男女性别有关,尽管这次航班中男性晕机的比例比女性晕机的比例高”.

需要注意的是,我们同时也没有理由,或没有足够的证据说明A,B无关,即,也没有理由说晕机与否跟男女性别无关,而不是教科书上(P78)提到的当χ2≤3.841时,认为事件A与B是无关的.

举例来说:在羽毛球双打比赛中,若A球员击球,得分的概率较大,B球员击球,得分的概率也较大,当我们发现有一个球员击球得分了(但没有看清是谁),我们就无法判断是A还是B击球. 只有在我们已知A球员击球,得分的概率较小时,若发现一球员击球得分,我们推测较可能不是A球员击球,即B球员击球.当然,也有可能若A球员击球, B球员击球,得分的概率都较小,此时,我们不易判断击球的球员.

这在统计中是很常见的现象. 因为统计学本身就是利用样本分析、推断总体的科学,即,用部分信息来推测全部信息,就难免出现信息不足无法得出结论的情况.

参考文献

[1]李勇, 张淑梅. 关于高中教材中独立性检验知识呈现方式的思考[J]. 数学通报, 2010, 49(11):25-26.

作者简介王立东(1983—),黑龙江人,教育学博士,北京师范大学中国基础教育质量监测协同创新中心师资博士后,中学一级教师,主要从事数学教学论、教育测量评价的研究与实践.endprint

猜你喜欢
犯错误独立性教科书
完形乐园趣多多
独立品格培养
打麦
藏起来的教科书
藏起来的教科书
智珠二则
藏起来的教科书
做最好的自己
犯错误找家长
第一印象