统计解题中经典错解剖析

2020-02-29 02:57王小莉
高中数理化 2020年1期
关键词:点睛年收入平均数

王小莉

统计是高中数学的重要内容,每年的高考中都有涉及,在求解与统计相关的问题时,学生常常会由于审题不严、考虑不周、忽视甚至挖掘不出题目的隐含条件等原因出现解题错误.本文就一些常见的问题加以剖析,以期帮助同学们避免出现同样的错误.

1 对个体的入样可能性理解不透

例1中央电视台动画城节目为了对本周的热心观众给予奖励,要从2 014名小观众中抽取50名幸运小观众.先用简单随机抽样从2 014人中剔除14人,剩下的2 000人再按系统抽样方法抽取50人,则在2 014人中,每个人被抽取的可能性( ).

A. 均不相等

B. 不全相等

错解选A或D.

剖析对于选项A,常有学生误认为剔除14人,被抽取到的机会就不相等了,从而错选A;对于选项D,有的学生会认为被抽取的机会相等,但利用剔除后的数据计算,从而错选D.

点睛系统抽样具有等可能性,即每个个体被抽到的可能性相等.

2 忽略分层抽样的特点

例2某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是( ).

A. 简单随机抽样

B. 系统抽样

C. 直接运用分层抽样

D. 先从老年人中剔除1人,再用分层抽样

剖析如果用简单随机抽样先从老年人中剔除1人,老年人被抽到的概率显然比其他人群小了,这不符合随机抽样的特征——每个个体入样的概率相等.注意错解中明确地说“先从老年人中剔除1人”这和从总体中随机剔除1人是不一样的.

点睛分层抽样的一个很重要的特点就是每个个体被抽到的概率相等.当按照比例计算出的值不是整数时,一般是采用四舍五入的方法取值,若四舍五入后得到的样本容量与要求的不相同,则可根据问题的实际意义适当处理,使之相同,但不能改变分层抽样的本质.

3 误将频率分布直方图的纵坐标当作频率

例3中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图1所示,从左至右五个小组的频率之比为5∶7∶12∶10∶6,则该市6万名高一学生中视力在[3.95,4.25)内的学生约有多少人?

图1

剖析表面上看本题的回答似乎正确无误,其实答案是错误的,其错因在于没有看懂所提供的频率分布直方图中数据的含义,误将该频率分布直方图中的纵坐标(频率与组距的比)当成了频率,从而导致问题的解答出错.

点睛解答本题时需注意纵坐标为频率/组距.绘制频率分布直方图的注意事项如下:

1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.

2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,组数越多.

3)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字计数法确定各个小组内数据的个数.

4)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.

4 对茎叶图的画法规则认识不够

例4某市对上下班情况作了抽样调查,在上下班时间各抽测了12辆机动车的车速如下(单位:km·h-1).

上班时间:30,33,18,27,32,40,26,28,21,28,35,20;

下班时间:27,19,32,29,36,29,30,22,25,16,17,30.

用茎叶图表示以上数据.

错解机动车行驶速度的茎叶图,如图2所示.

上班下班[5]81679876102257953203026[5]04

图2

剖析茎叶图需要对于重复出现的数据进行重复记录.

正解机动车行驶速度的茎叶图如图3.

上班下班[6]81679887610225799532030026[6]04

图3

点睛画茎叶图需要注意将每个数据分为茎和叶两部分,将表示茎的数字按照由小到大的顺序由上到下排列,在写每行叶子的时候,重复出现的数字也应该按原次数写入叶子部位,不能只按一次写入.

5 忽略方差的统计意义

例5甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如表1(单位:t·km-2).

表1

若某村要从中引进一种冬小麦大量种植,给出你的建议.

错解由题意得

甲、乙两种冬小麦的平均产量都等于10,所以引进两种冬小麦的任意一种都可以.

剖析上述错误在于只对两种冬小麦的平均产量做了比较,而忽略了对冬小麦产量稳定性的讨论.

正解由题意得

点睛平均数反映的是样本个体的平均水平,方差和标准差则反映了样本的离散程度.对于形如“谁发挥更好、谁更稳定、谁更优秀”之类的问题,除比较数据的平均值外,还应该比较方差或标准差的大小,以作出更为公正、合理的判断.

6 弄错回归方程中的位置

例6某班5名学生的数学和物理成绩如表2.

表2

(1)画出散点图;

(2)求物理成绩y对数学成绩x的线性回归方程.

错解(1)散点图如图4所示.

图4

(2)计算得

66×64+63×61=25 054,

732+662+632=27 174,

所以

7 忽略求回归方程的前提——线性相关

例7假设某设备的使用年限和所支出的维修费用如表3中统计资料所示.

表3

能否用线性回归模型描述两个变量间的关系?

剖析没有先判断两个变量是否具有线性相关关系.

正解画出散点图,如图5所示,

图5

从散点图上看,这些点的分布几乎没有什么规律,故不能用线性回归模型描述两个变量之间的关系.

8 没有准确掌握公式中参数的含义

例8有甲、乙两个班级进行一门考试,将学生考试成绩按照优秀和不优秀统计后,得到列联表(如表4).

表4 班级与成绩列联表

试问能有多大把握认为“成绩与所在班级有关系”?

参考公式及数据:

其中n=a+b+c+d.

表5

错解计算得K2的观测值为

因为56.86>6.635,所以有99%的把握认为“成绩与所在班级有关系”.

剖析由于对2×2列联表中a,b,c,d的位置不清楚,所以在代入公式时代错了数值,导致计算结果错误.

正解计算得K2的观测值为

因为0.653<3.841,所以没有充分证据认为“成绩与所在班级有关系”.

点睛独立性检验中,参数K2的公式复杂,计算量大,要弄清公式的特点,熟记公式,避免因粗心而出现错误.

链接练习

已知数据x1,x2,x3,…,xn是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn+1,则这n+1个数据中,下列说法正确的是( ).

A. 年收入平均数大大增大,中位数一定变大,方差可能不变

B. 年收入平均数大大增大,中位数可能不变,方差变大

C. 年收入平均数大大增大,中位数可能不变,方差也不变

D. 年收入平均数大大增大,中位数可能不变,方差可能不变

链接练习参考答案

B.

猜你喜欢
点睛年收入平均数
No.3 海底捞预计2021年最高亏损45亿元
年收入3000万美元的玩具网红
“配角”也点睛
不一样的平均数
名师点睛(9)
画“狮”点睛
“轴对称”复习点睛
最难成为1%人群的美国州
关注加权平均数中的“权”
平均数应用举隅