有关选修23《独立性检验》结论解释的商榷

2018-01-16 17:36王立东

中学数学杂志(高中版) 2017年6期

【摘要】针对选修23《独立性检验》中有关χ2统计量计算结果解释的若干问题进行了探讨，给出一个在教学中较为恰当的解释方式，有助于学生对于独立性检验有较为全面的认识.

【关键词】χ2统计量；独立性检验；统计推断

在人民教育出版社编写的普通高中课程标准实验教科书《数学》B版选修23中的《独立性检验》一章中，对于统计检验结果的描述有若干需要商榷的地方.

1.在教科书中有如下描述（P78）：

经过对χ2统计量分布的研究，已经得到了两个临界值：3.841与6.635.当根据具体的数据算出的χ2>3.841时，有95%的把握说A与B有关；当χ2>6.635时，有99%的把握说事件A与B有关.当χ2≤3.841时，认为事件A与B是无关的.

2.我们有95%（或99%）的把握说事件A与B有关，是指推断犯错误的可能性为5%（或1%），这也常常说成是“以95%（或99%）的概率”，其含义是一样的.

我们说，高中教科书中所介绍的独立性检验的思想，相当于运用统计学的知识发现，在假设事件A与B独立的前提下，所得样本的χ2>3.841的概率为5%，χ2>6.635的概率为1%，即P（χ2>6.635）|P（AB）=P（A）P（B））=0.05，P（χ2>3.841）|P（AB）=P（A）P（B））=0.01. 从而我们现有的样本χ2统计量大于临界值，则说明一个小概率事件发生了，于是我们认为，很有可能是我们的假设有误，即A，B很可能不独立. 需要注意的是，这里的5%（1%）不是我們推断犯错误的概率.

教科书提到的，所谓推断犯错误的概率，应当是对于一个χ2>3.841的样本，如果我们下一个推断：A与B不独立，那么，我们犯错误的概率（即A，B其实是独立），即P（P（AB）=P（A）P（B）|χ2>3.841|）. 显然，从条件概率的角度，这与之前计算的5%或者1%是不同的.我们只能说，针对1%的情况，我们推断犯错误的概率比5%的情况要小.于是我们仅用所谓99%的把握和95%的把握来描述我们所做推断，这个并不是教科书上所提到的“概率”[1].

同时，当样本的χ2统计量小于临界值的时候，说明在独立假设的前提下，得到这种χ2值的可能性比较大，但是，这并不意味着独立假设成立的可能性大.因为，我们并不知道，在不独立的假设下，产生这种样本χ2值的概率，如果这个概率也较大，我们就不能确定是否这个样本是来自于哪种假设，此时，只能说我们没有理由，或没有足够的证据说明A，B有关，例如，教科书（P79）的描述，“应为3689<3841，我们没有理由说晕机与否跟男女性别有关，尽管这次航班中男性晕机的比例比女性晕机的比例高”.

需要注意的是，我们同时也没有理由，或没有足够的证据说明A，B无关，即，也没有理由说晕机与否跟男女性别无关，而不是教科书上（P78）提到的当χ2≤3.841时，认为事件A与B是无关的.

举例来说：在羽毛球双打比赛中，若A球员击球，得分的概率较大，B球员击球，得分的概率也较大，当我们发现有一个球员击球得分了（但没有看清是谁），我们就无法判断是A还是B击球. 只有在我们已知A球员击球，得分的概率较小时，若发现一球员击球得分，我们推测较可能不是A球员击球，即B球员击球.当然，也有可能若A球员击球， B球员击球，得分的概率都较小，此时，我们不易判断击球的球员.

这在统计中是很常见的现象. 因为统计学本身就是利用样本分析、推断总体的科学，即，用部分信息来推测全部信息，就难免出现信息不足无法得出结论的情况.

参考文献

[1]李勇，张淑梅. 关于高中教材中独立性检验知识呈现方式的思考[J]. 数学通报， 2010， 49（11）：25-26.

作者简介王立东（1983—），黑龙江人，教育学博士，北京师范大学中国基础教育质量监测协同创新中心师资博士后，中学一级教师，主要从事数学教学论、教育测量评价的研究与实践.endprint