关于几个统计量的教学思考

2023-08-19 18:19翁高成
福建中学数学 2023年1期
关键词:代表性平均数中位数

翁高成

1 背景介绍

初中阶段对几个统计量的教学实施大部分都流于表面,更多时候把侧重点放在技能的训练上,而不注重对几个统计量的概念理解,导致原本课标设置好的两条主线,即数据的“集中趋势”和“离散趋势”,未能在教学中得到具体的贯彻和落实,从而导致学生数据分析的观念薄弱.这一切的根源在于许多教师自己本身也未弄清这几个常用统计量的区别与联系,所以无法把控教学关键,不能进行精准教学.本文将结合统计学理论和实际的教学案例来重点谈谈“平均数、中位数、众数、方差”这几个统计量在本质上的区别和关联以及本人在教学中落实两条主线的具体措施,旨在初中阶段引导学生形成较为成熟的数据分析观念,以便顺利对接高中统计模块的学习,并促成学生拥有适应未来生活的基本统计意识.

2 集中趋势和离散趋势

2.1 概念理解

“集中趋势”又称“数据的中心位置”“集中量数”等,它是一组数据的代表值.集中趋势的概念就是平均数的概念,可以用它表明所研究的总体现象在一定时间、空间条件下的共同性质和一般水平.从变量数列的角度来说,由于整个变量数列是以平均数为中心而上下波动的,由此可以看出平均数反映了总体分布的集中趋势,它很好地代表了总体分布的某些重要特征.依据变量数列的平均数,就可以了解所研究总体的一般特征和集中趋势.数据的集中趋势是用来描述分析总体现象的重要统计指标,常用的有平均数、中位数和众数等,它们在不同类型的分布数列中有不同的测定方法.

“离散趋势”是指在统计学上描述观测值偏离中心位置的趋势,反映了所有观测值偏离中心的分布情况.描述一组数据“离散趋势”的常用统计量有极差、方差、标准差、标准误差、四分位数间距和变异系数等,其中方差和标准差最常用,人教版中学数学教材介绍了极差和方差,对标准差不作教学要求,放置在课后的阅读材料中供学生拓展了解.

2.2 教学思考

人教版教材在编排时,严格遵循统计学的概念.在“数据的分析”这一章节设置了“数据的集中趋势”和“数据的波动程度”两部分的内容.希望借助具体的实例,加强学生对两个概念的初步认识.

从以上论述可以看出“集中趋势”和“离散趋势”是极其抽象的统计学术语,在教学过程中,直接把这两个名词传递给学生,希望学生能理解概念的字面意思,基本是教师的一厢情愿.这样的做法不仅没有让学生更易于接受和理解概念,反而容易让学生对统计学概念的本质流于表面.但是,课标又希望学生能形成初步感知,那么在具体教学中应如何处理这部分内容呢?以下谈几点个人想法:

(1)可以在“数据分析”这一章节前,布置学生收集相关的材料,材料的内容可以包括平均数的意义和用处、分析数据常用的方法、分析数据常用的几个统计量、统计学的发展历史等,从收集材料中获得对“统计学”的初步印象,然后设计一堂阅读活动课,让学生分享成果,达到对“集中”和“离散”的初步认知.至少让学生明白数学知识的来龙去脉,以及知识间的关联.

(2)教材在介绍“数据的波动程度”时,在这一节课用了三个具体事例,这些事例中涉及的数据都故意选用一些“平均数”近似相等的实例,教材这么选材的目的:一是旨在告诉学生,当通过集中趋势分析数据无法帮忙做出决策时,关注数据的离散趋势可以给我们提供另外一个决策角度;另一目的就是不希望给出的模型太过理想,让学生觉得只有当平均数一样时,才能考虑方差.很显然,“集中趋势”和“离散趋势”只是决策时分析数据的角度而已,我们也可以多借助这样的题目,让学生形成对“集中”和“离散”的初步认识.

3 平均数、中位数和众数

3.1 来源和关联

在分析数据的时候,经常会用到平均数、中位数和众数,主要是为了分析数据的“集中趋势”,但是学生并不知道这些统计量的关联,要想让学生很好地了解如何利用它们来进行数据“集中趋势”的描述,只知道如何计算它们是不够的.所以,知道这些统计量之间的关联是很有必要的.

总的来说,获得数据“集中趋势”的方法有两种:数值平均数和位置平均数.

数值平均数就是从总体各单位变量值中抽象出具有一般水平的量,这个量不是各个单位的具体变量值,但又要反映总体各单位的一般水平,包含算术平均数、加权平均数、几何平均数、调和平均数等.顾名思义,位置平均数就是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值,它对于整个总体来说,具有非常直观的代表性,因此,也经常用来反映分布的集中趋势,常见的有众数、中位数.

3.2 教学思考

简单来说,“平均数,中位数,众数”从本质上来看其实就是不同形式的“平均数”,用来反映数据的“集中趋势”.换个思路,既然三者的作用一样,那么在课堂或者课后练习中就应该多设置一些开放性的题目,回答时需要同时考虑到这三个统计量,利用三者分别对这组数据的“集中趋势”进行描述,最后选用最合适的或者最符合具体需求的进行决策,而不是重点突出“平均数”的地位和作用.也就是说,设置的问题必须要求决策者在进行数据分析时,需要考虑全面,进行权衡,有理有据,方可作出合适的决策.举例如下:

例1 两个群体A,B的年龄如下:

A:12,12,13,14,14,14,14,15,16,16;

B:4,5,5,6,6,7,7,7,65,67.

(1)求出群體A年龄的平均数、中位数和众数.你觉得用哪个统计量可以较好地描述该群体年龄的集中趋势?

(2)求出群体B年龄的平均数、中位数和众数.你觉得用哪个统计量可以较好地描述该群体年龄的集中趋势?

一个统计量用来描述这组数据是否合适,其实涉及到很多统计学的知识.粗略地讲,只有当数据的个数很多时,我们才需较真这三个统计量在不同数据分布中的联系和区别:如果数据是正态分布,那么这三个统计量都相等,位置居于分布的中轴线;如果数据是偏态分布,这三个统计量可用来描述这个分布的偏斜程度.总的来说,平均数的代表性最大,因为所有数据都参与运算,中位数代表性小一些,众数代表性最差.在选用这些统计量时,要从分析需要和数据的具体情况两方面考虑.当数据中没有极端值,分布较对称,应选用平均数.当数据分布不对称,分布的一端有极端数值时,应选用中位数.当需要粗略地和快速地了解数据集中趋势时,我们就可选用众数.

4 差异量数

差异量数即离散趋势量数,是表示样本数据偏离中间数值的趋势的量数,或者说它是反映样本频率分布离散程度的量数.初中教材中的极差、方差、标准差都是差异量数.

4.1 教学思考1

如果差异量数比较小,那么代表各数值较集中、整齐,波动小;反之,如果差异量数比较大,那么各数值分布的范围广且参差不齐.所以,差异量数可以反映出集中量数的代表性如何.可以这么说,差异量数越大,则集中量数的代表性就越小;差异量数越小,则集中量数的代表性就越大.比如,我们经常会碰到两组数据的平均数一样,但是两组数据的离散程度不同.一组数据的分布可能差异较小,比较集中,那么就说明平均数的代表性较好.另一组数据可能差异较大,比较分散,那么平均数的代表性就较差.那么,在教学过程中,给数据分析的问题里添加差异量数的内容就可以说是非常有必要.通过计算差异量数,从而认识数据的“离散趋势”,为决策提供依据.举例如下:

例2 甲、乙两名选手在相同条件下各射击10次,每次命中的环数如下:

甲:6,5,4,6,7,8,8,9,10,7;

乙:6,7,7,6,7,9,8,5,7,8.

(1)求出甲、乙两人的方差;

(2)结合计算结果,分析一下两名选手的射击情况.

这种类型题目的引入,有利于学生认识到:当数据的平均数相等时,数据之间还是存在其它的不同,比如这两组数据的波动大小、整齐程度不同,乙较为集中,甲较为参差不齐,那么引入方差来描述这种情形显得很有必要.实际情境中,两个人平均实力相同,谁的成绩更为稳定,就显得相当重要.此时考虑差异量数,可以让我们考虑问题更加全面,做出决策更加合理.

4.2 教学思考2

上述题目,两组数据的平均数相同,但是很顯然,仅仅考虑平均数是不够的,数值分布参差不齐时,平均数的代表性就差,这时需要差异量数介入分析,即求出这两组数据的方差.换句话说,仅仅用集中趋势来描述数据的分布特征是不够的,只有把两者结合起来,才能全面地认识事物.既然这样,给教学是否可以带来另一种思考.我们中学阶段碰到的这类型的题目往往都是数据的平均数相同,最后通过计算方差,利用方差,反映数据的波动大小、稳定情况,从而做出决策,这样单一类型的题,容易让学生产生这样的疑问:“难道只有当数据的平均数相同时,方差才有可能派上用场?”

很显然,这样的思维定势,容易弱化差异量数在分析数据时的作用,对于数据分析的全面性是很不利的,学生容易偏向考虑数据的“集中趋势”,而忽视“离散趋势”的价值.所以,在教学上,我们可以考虑设置一些平均数不相同,然后借助方差来参与数据分析的题目.例如,对上述的甲、乙两人成绩做一个小小的改动,得到如下题目: 例3 甲、乙两名选手在相同条件下各射击10次,每次命中的环数如下:

甲:8,9,10,6,8,5,4,6,7,7;

乙:6,7,7,6,7,8,8,5,7,8.

(1)求出甲、乙两人的方差;

(2)结合计算结果,分析一下两名选手的射击情况.

学生通过计算会发现,二者的平均成绩相差不大.甲的平均成绩是7,乙的平均成绩是6.9.教师可以在此时提问:是否说明甲的射击水平更加优秀呢?通过这样的提问,学生会产生不同的看法,有的认为甲的平均成绩高,所以甲比较优秀,但是也有同学认为,两人的平均成绩相差并不大,乙的方差比甲小,说明乙更稳定,综合来看,乙应该更优秀.通过这样的问题设置,激发学生的思考和讨论,从而让学生明白,对于数据的分析,应该根据具体情况,必要时需要把“集中趋势”和“离散趋势”结合起来,这样看待事物才会更全面.另外,数据分析重在用合适的统计量进行有理有据的说理分析,不在于一定要分个高低胜负,贵在对每个统计量作用的体会和理解上.

猜你喜欢
代表性平均数中位数
国家级非遗项目代表性传承人简介
漳州市非物质文化遗产代表性项目代表性传承人名录
闽台地区代表性道地药材
中位数计算公式及数学性质的新认识
不一样的平均数
非遗代表性传承人
——勉冲·罗布斯达
关注加权平均数中的“权”
平均数应用举隅
说说加权平均数
导学案不能沦落为“习题单”:以“中位数和众数”的导学案为例