基于唯物辩证法的概率论与数理统计课程思政建设与实践

2022-05-07 02:45张丽静赵鲁涛
大学数学 2022年2期
关键词:贝叶斯概率课程

张丽静, 赵鲁涛, 李 娜

(北京科技大学 数理学院,北京100083)

1 引 言

为贯彻和落实习近平总书记在全国教育工作会议和全国高校思想政治工作会议上的讲话精神,把思想政治工作贯穿教育教学全过程,开创我国高等教育事业发展新局面.各高校积极开展课程思政教学改革,把立德树人作为中心环节[1-2],对课程思政建设存在的问题进行分析[3],研究课程思政的实施途径[4-5]及课程思政教学体系的构建[6-7]等.

目前针对高校理工科本科生的必修课之一——概率论与数理统计课程思政的研究较少.在这些研究中,其核心内容是将思政元素渗入到课程思政中[8-9],通过不同的方法或途径达到课程思政的目的.

文章对概率论与数理统计课程思政建设与实践进行了深入的研究,着重将唯物辩证法的认识论和方法论润物无声地融入到教学过程中,以点带面,横向展开,纵向深入,结合大量具体的应用案例,将普遍联系的观点、质量互变规律、现象和本质、原因和结果以及偶然性和必然性的辩证关系融入教学设计,引导学生在学习知识的同时,树立正确的人生观、价值观和世界观.此外,在教学过程中强调实践性,通过学生亲自动手,收集资料,撰写论文,运用与本课程相关的知识解决实际问题,从而达到课程思政的目的,提高学生独立思考能力、创新思维能力以及解决复杂问题的综合能力.

2 用“普遍联系”的观点讲解知识点

唯物辩证法用普遍联系的观点看待世界和事物.认为世界是一个有机的整体,一切事物都相互影响、相互作用和相互制约.这种联系具有客观性、普遍性和多样性.

由于概率论与数理统计课程内容的复杂性,知识点之间的联系有的偶露端倪,有的深藏不露,这就需要我们在教学过程中不断启发学生有意识地去发现问题,深入思考.联系的“客观性、普遍性和多样性”为揭示知识点之间的联系提供了有效的研究方法和途径,学生不是孤立片面地局限于每个知识点地理解,而是学会从联系的角度去把握概念的本质,多方面的分析问题,提升学生的数学思维及理性思辨能力.

2.1 泊松分布与指数分布的联系

泊松分布作为描述大量试验中稀有事件出现次数的一种概率模型,在现实生活中有许多实际应用.比如,急救台一昼夜接到的呼唤次数,某一批产品中的次品数,一年内保险的某种理赔次数等.

指数分布是描述泊松过程中事件间隔时间的概率分布,是伽马分布的特殊情况.指数分布应用广泛,许多电子产品寿命、复杂系统寿命都服从或近似服从指数分布.因此它在可靠性研究中是最常用的一种概率分布.

泊松分布与指数分布分别对应不同类型的随机变量,即离散型和连续型,解决的实际问题也完全不同.引导学生思考,它们之间会不会有某种联系?如果有,如何定量描述?结合下面的应用案例,启发学生分析寻找它们之间的密切关系,帮助学生从已学过的泊松分布过渡到指数分布,从离散型随机变量切换到连续型随机变量,对于加强学生对这两种概率分布的理解有着非常重要的意义[10].

应用案例1 婴儿出生问题

假设某医院在时间(0,t)内出生的婴儿数N(t)服从泊松分布,即

其中,λ表示一小时平均出生的婴儿数.为了寻找两者的联系,启发学生思考,未来t小时内没有婴儿出生的概率是多大?利用泊松分布计算得到

进一步启发学生去思考婴儿出生时间间隔T的概率分布是什么?显然T是一个连续型随机变量.请学生关注随机变量T与N(t)发生联系的关键点,在于“婴儿出生时间间隔T大于t”等同于“在时间间隔为t的时间段内没有婴儿出生”,即

P(T>t)=P(N(t)=0)=e-λt.

由此得到T的分布函数和概率密度函数分别是

这样就成功地由泊松分布过渡到了指数分布.

2.2 置信区间与拒绝域的联系

区间估计与假设检验是数理统计中两种常用的统计推断方法,是学生易于求解,但难于理解到位的两种方法.由于分不清它们之间相同与不同,在解决实际问题时,常常混淆用错.究其原因是这两个知识点的讲解各行其是,各不相谋.唯物辩证法告诉我们,事物之间存在着普遍而广泛的联系,彼此相互影响,相互制约.在教学中加强这两种统计方法的对比和联系,可以大大提升学生对概念的理解和掌握.

课堂教学中,以单个正态总体N(μ,σ2)为例(参数μ),启发学生从图1中对比区间估计与假设检验,找出它们之间的联系与区别.

(a)

从对比中学生不难发现,区间估计与假设检验的联系有以下三点:

(i)前者的枢轴量和后者的检验统计量完全相同;

(ii)前者的置信区间与后者的接受域完全相同;

(iii)前者与后者所得结论也完全对应.如果总体参数μ落在置信区间里,则假设检验就不会拒绝原假设;如果总体参数μ没有落在置信区间里,则假设检验就会拒绝原假设.

进一步引导学生关注两者的差异,虽然两者都是利用样本信息推断总体参数,但是应用的角度却大相径庭.如果对总体参数一无所知时,应该用区间估计的方法进行解决;如果对总体参数有所了解但不确定,有怀疑需要验证时,就需要用假设检验方法来处理.

下面通过应用案例的分析,强调两者应用上的差异,指导学生选择正确的方法,培养学生学以致用的能力.

应用案例2 (i)婴儿体重区间估计

解由于该地区新生男婴平均体重无据可查,所以判断这是双侧置信区间问题.因为X~N(μ,σ2),μ,σ2未知,故选择枢轴量

计算总体均值μ的置信区间

即该地区新生男婴平均体重的置信区间为(3232.6,3467.4).根据《世界卫生组织婴儿体重标准》,男婴标准体重应为3300克,属于该置信区间.

应用案例2 (ii)婴儿体重假设检验

在上述问题中,给定显著性水平α=0.05.要求利用样本信息判断,能否认为该地区男婴平均体重达到了《世界卫生组织婴儿体重标准》的3300克?

解显然这个问题对总体参数有大致了解,但不能确定是否达标.因此这是双边假设检验问题.根据实际问题提出假设,

H0:μ=μ0=3300,H1:μ≠μ0.

3 用“质量互变”规律讲解中心极限定理

唯物辩证法认为任何事物都具有质和量两个属性.量变是事物连续的不显著的变化,而质变是事物根本的变化,是一种飞跃.质量互变规律,即从量变到质变,总是由微小的量变慢慢积累开始,当这种积累达到一定程度时就会导致事物由一种性质变化到另一种性质,即质变.量变是质变的准备,没有量变就不会发生质变.

在概率论与数理统计课程中,研究随机变量和的概率分布是一个重要的内容.遗憾的是只有少数分布具有可加性,能够得到和的精确分布,比如正态分布等.而大多数情形中,和的分布与随机变量累加的个数有很大关系.启发学生思考,随着随机变量累加个数的增加,和的分布是否会呈现某种规律性?通过数值模拟,先请同学们观察两种简单的情况:

情况1n个独立的均匀分布和的分布

假设n=1时,随机变量X~U(0,2),密度函数图形见图2(a);则n=2时,两个相互独立的服从(0,2)上均匀分布的随机变量和的密度函数为

该函数的图形见图2(b);当n=20时,计算机模拟20个相互独立的服从(0,2)上均匀分布的随机变量和的密度函数图形见图2(c).

(a) (b) (c)

情况2n个独立的泊松分布和的分布

假设n=1时,随机变量服从参数λ=1的泊松分布X~P(1),其分布律见图3(a);

当n=2时,两个相互独立的均服从参数λ=1的泊松分布和的分布仍服从泊松分布(参数λ=2),其分布律见图3(b);

当n=20时,20个相互独立的均服从参数λ=1的泊松分布和的分布律见图3(c).

(a) (b) (c)

通过观察不难发现一个神奇的结果:n个独立的均匀分布或泊松分布和的分布随着n的增加,都会不约而同地越来越接近正态分布.也就是说随机变量和的分布,当n比较小的时候具有不确定性、随机性,但随着n的增加,势必会呈现出一个确定的变化趋势——向正态分布靠拢.这正是量的积累带来质的飞跃,也正是中心极限定理要揭示的大量随机变量中的统计规律性.

中心极限定理使学生充分认识到,数学定理揭示自然现象中的数量规律也完全符合唯物辩证法揭示一般事物存在的客观规律,因此唯物辩证法的认识论和方法论是我们探究未知世界的锐利武器.

下面的应用案例可以带领学生去领略,中心极限定理解决实际问题时展示出化繁为简的非凡能力,以及在运算过程中带来极大的方便.同时告诫学生,在享受数学家杰出贡献带来便利的同时,还要学习和继承数学家们孜孜不倦的科学精神.

应用案例3 食堂窗口规划问题

学校食堂每天中午都要为全校约10000名学生提供午餐.假设每个学生在窗口打饭的时间相互独立,都服从参数λ=2的指数分布.为了能以99%的概率在90分钟内让所有学生完成打饭,至少需要开设多少个窗口?

引导学生思考,需要先利用卷积公式去求10000个指数分布和的精确分布吗?可以课后尝试,会发现即便求出精确分布,计算概率也十分麻烦.现在利用中心极限定理可以化繁为简,得到X的近似分布为正态分布.

查表得Φ(2.33)=0.9901,解得k≈57.即食堂至少需要开设 57个窗口,才能以99%的概率使得所有学生在规定时内打完饭.

4 用“现象和本质”的辩证关系讲解数学期望

唯物辩证法认为现象是事物的表面特征,只需靠感官即能认知;而本质是隐藏在事物内部的根本性质,需要依靠抽象思维来把握.任何现象都由本质所决定,都是本质的某种表现;同时,任何本质都要通过一种或多种现象表现出来.因此,认识事物总是通过对现象的分析研究才能了解到事物的本质,这个分析研究的过程就是去粗取精、去伪存真、由此及彼、由表及里的过程.

研究随机变量的数字特征是概率论的重要任务之一,而数学期望是随机变量最重要的一个数字特征,是研究其它数字特征的基础.数学期望在众多领域中都有着广泛的应用,并且在后续课程——统计学中,也起着非常重要的作用,因此掌握好数学期望对本课程的学习有着重要的意义.

随机变量数学期望的研究分为多层次和多方面:离散和连续、一维和二维以及随机变量函数的数学期望.多个数学期望的定义和计算一起扑面而来,信息量非常之大,学生容易囫囵吞枣,理解不深入,造成只记公式而不明其意的结果.如何解决这种困难局面?唯物辩证法告诉我们,要在众多繁杂的现象中挖掘共同的本质,这是解决困难的关键和捷径.

4.1 离散型随机变量的数学期望

教学过程中先通过应用案例——投资决策问题的分析,启发学生发现揭示数学期望的本质,然后在这种本质的引领下展开五种情况数学期望的分析和研究.

应用案例4 投资决策问题

假设有一支股票价格为18元/股,一年后变为18 +X元/股,X是一年中股票价格的改变量,假设银行一年的存款利率为3%.有位投资者正在考虑是否投资该支股票并持有一年的时间.他应如何做出决策才能使获利较大?

显然X是一个随机变量,由于未来股票价格可能涨也可能跌,每股收益X随之飘忽不定,因此需要用一个数量指标来定量描述才能方便投资者做出决策.启发学生思考,这个数量指标如何定义才合理呢?首先根据该支股票的历史数据,假设可以统计得到X的分布律:

X-2-1014Pk0.10.10.40.20.2

由分布律可以看到,股价未来一年中的涨跌情况和相应的概率.“平均值”是大家不约而同都能想到的一个数量指标.那么关键是“平均值”如何定义才能够真实地反映出股票的收益情况呢?尝试算术平均值会怎么样?由于没有考虑概率信息,显然不合理.引导学生进一步分析,每股收益X每个可能的取值对“平均值”都有“贡献”,取值的概率越大,该值对“平均值”的“贡献”越大.因此每股收益X的“平均值”直观理解为依概率“加权”平均是合理的,即

-2×0.1+(-1)×0.1+0×0.4+1×0.2+4×0.2=0.7.

这个平均值,即每股平均收益就称为X的数学期望.经比较,一年的存款利息收入为18×0.03=0.54<0.7,于是得到一个合理的投资建议:投资者应该投资并持有该支股票.

4.2 离散情况到连续情况的推广

图4 连续情况离散化

通过上述由连续情况分解到离散情况再回归到连续情况的分析和讨论,学生对于隐藏在积分表达式中的数学期望的本质有了深刻的理解.

4.3 其他情况

如何继续将依概率“加权”平均的思想迁移贯穿到以下随机变量函数的数学期望中,即

此处可以鼓励学生独立地去实践和完成.

从以上的案例学习中,培养学生分析问题的能力,即由表象深入到达本质的能力是我们教学过程中的主要目标之一,但这种能力并不是一蹴而就,需要课堂上通过启发引导,教学演示及实践练习才能达到预期效果.

5 用“原因和结果”的辩证关系讲解贝叶斯公式

唯物辩证法认为一个原因一定会造成某种结果或影响,而一个结果又必然来源于某些原因.一个原因可以引起几个结果,而一个结果也往往由几个原因所引起.原因和结果相互依存,没有无因之果,也没有无果之因,原因和结果在一定条件下可以相互转化.

在日常生活中,经常会遇到由因求果的问题,也会遇到由果溯因的问题.比如某种传染病已经出现,寻找传染源;机械发生了故障,寻找故障源等.贝叶斯公式正是用来求解这类由果溯因问题而产生.贝叶斯公式不仅是概率论与数理统计中的一个重要教学内容,也是贝叶斯统计的核心和理论基石,在整个学习中占有相当重要的地位.

例如,结果A已经发生了,在众多可能的原因中,研究到底哪个原因导致了这个结果.贝叶斯公式阐明了各原因所起作用的大小可以用P(Bi|A)来刻画,而概率值最大的那个原因就是我们关注的对象,这就是贝叶斯决策的思想.

应用案例5 疾病诊断问题

某一地区某疾病的发病率为0.005,假设这种疾病检测结果的可靠度0.95,即对患者进行检测,结果为阳性的概率为0.95.若正常人检测结果为阳性的概率为0.04.现在随机的抽查一个人,检测结果为阳性.问此人患有这种疾病的可能性是多少?

解记事件A为“检测结果为阳性”,C为“此疾病患者”,求P(C|A).

由条件知:

根据贝叶斯公式有

即此人患病的可能性为0.1066.这个指标仅为10%,不足以为医生确诊提供依据.但患者检测呈阳性的可靠度高达95%,如何解释这种现象?引导学生分析其中原委.

分析原因注意到发病率,即先验概率P(C)=0.005非常之小,尽管患者检测阳性的可靠度P(A|C)=0.95足够高,但是在计算中,由于它的权重0.005微不足道,所以导致阳性确诊率,即后验概率P(C|A)=0.1066比较小.如果发病率由0.005下降为0.0005,则这个后验概率会更小,经计算得P(C|A)=0.0119.这说明越是罕见疾病越容易造成误诊.

复检讨论贝叶斯公式的强大功能在于,如果让检测阳性的人复检,即用一次阳性患病率P(C|A)=0.1066代替发病率P(C)=0.005,再使用贝叶斯公式计算,二次阳性发病率将会大大提高.计算过程如下:

如果让此人第三次复检,类似计算可以得到三次阳性发病率将高达98.54%,已经超过了检测可靠度0.95.之所以确诊率迅速提高,究其原因是贝叶斯公式中的权重P(C)由0.005到0.1066,再到0.7392迅速增大所致.它们之间精确的变化关系见图5所示.

图5 后验概率与先验概率的函数关系图

图形分析图5是后验概率P(C|A)与先验概率P(C)的函数关系图.从图中明显看出,随着P(C)的增大,P(C|A)开始会急剧上升,即在0附近函数图形非常陡峭.但当发病率P(C)大于0.5时,可以认为是某传染性疾病来袭,P(C|A)大于0.95.此时检测为阳性的患者,几乎可以定论是传染病患者了,需要及时隔离,并抓紧治疗.

实际问题中,除了由果溯因的问题,还有大量由因求果的问题,我们可以用基于贝叶斯公式的朴素贝叶斯算法来解决.

应用案例6 成绩预测问题

已知北京科技大学2014级某专业学生的英语入学成绩及三次期末考试成绩,利用朴素贝叶斯模型对英语四级通过情况进行预测[11].将1401班的英语成绩作为训练集,而1402班的英语成绩作为测试集.

解将学生的四个历史成绩 “入学成绩”“期末成绩1”“期末成绩2”“期末成绩3” 作为贝叶斯算法中的4个属性,并将每个属性的成绩分为四个等级:“优秀(85-100)”“良好(75-84)”“中等(60-74)”“差(小于59)”,分别标记为4,3,2,1.于是得到表1(左边是原始成绩,右边是经处理后的成绩).并设事件Y=“通过”,N=“没过”,带领学生对表1中的数据进行统计,得到以下概率:

表1 1401班英语成绩

(i)P(Y)=18/21, P(N)=3/21;

(ii)A的条件概率:P(A=2/Y)=5/18,P(A=1/Y)=13/18;P(A=2/N)=0,P(A=1/N)=1;

(iii)B的条件概率:P(B=3/Y)=9/18,P(B=2/Y)=9/18,P(B=1/Y)=0;P(B=2/N)=2/3,P(B=1/N)=1/3;

(iv)C的条件概率:

P(C=4/Y)=4/18, P(C=3/Y)=6/18, P(C=2/Y)=8/18,

P(C=1/Y)=0, P(C=3/N)=1/3, P(C=2/N)=2/3;

(v)D的条件概率:

P(D=4/Y)=2/18, P(D=3/Y)=6/18, P(D=2/Y)=10/18,

P(D=1/Y)=0, P(D=3/N)=0, P(D=2/N)=1.

将1402班21位同学的英语成绩每个属性分类处理以后得到表2,右数第二列是利用朴素贝叶斯模型对每个同学英语四级是否通过的预测值.

表2 1402班英语成绩

计算过程如下:

例如,对1402班的学生1英语四级是否通过进行预测,需计算并比较下面两个概率

P(Y|A=2,B=3,C=4,D=4), P(N|A=2,B=3,C=4,D=4).

根据贝叶斯公式,有

上式中,使用朴素贝叶斯算法,假设每一次的成绩是独立的,此处引导学生进行思考讨论.由于分母一样,因此比较分子的大小即可.计算如下:

由于

P(Y)P(A=2,B=3,C=4,D=4|Y)>P(N)P(A=2,B=3,C=4,D=4|N),

可以预测,该学生1“通过”四级考试.类似地,可以预测1402班其余20名同学是否通过英语四级考试,结果如表2所示.经计算预测正确率为18/21=0.857.

在上述讨论中,“原因”为四个英语成绩A,B,C,D,“结果”是英语四级考试“通过”和“没过”.四个原因的某种组合到底会导致哪种结果发生?朴素贝叶斯模型告诉我们,选择概率大的决策更有把握,成功率更大.

接下来引导学生思考,朴素贝叶斯算法是基于属性之间相互独立和对目标变量影响力一致的假设,但在实际应用中只有少数情况符合这一假设.因此,如何改进朴素贝叶斯算法来提高它的预测准确率与普适性仍是目前研究的热点问题.

从唯物辩证法出发,关于原因和结果多层次多角度的分析和讨论,对于开阔学生思路,提高学生创新思维能力以及学以致用的能力都发挥着重要的作用.

6 用“偶然性和必然性”的辩证关系讲解大数定律

唯物辩证法认为事物发展过程中必须发生的趋势是必然性;而可能出现,也可能不出现,或可能以多种不同形式出现的趋势是偶然性.两者地位不同:必然性居于决定地位,偶然性居于从属地位.两者作用不同:必然性决定事物发展的基本方向,而偶然性则使事物发展过程丰富多样.必然性和偶然性在一定条件下可以相互转化.

大数定律是概率论中讨论随机变量序列的算术平均值收敛到常数的定理,这一结论与中心极限定理一起,成为现代概率论、统计学、理论科学和社会科学的基石之一.它严格地证明了平均值的稳定性,也就是说当样本容量很大时,样本均值与真实值充分接近.

虽然随机现象具有偶然性,不确定性,但是从大量观测中可以分析归纳出它们内在的必然规律,并以大数定律揭示了这一规律.如何让学生理解偶然性中的必然规律,这是教学过程中的难点.唯物辩证法告诉我们,一切偶然性都会受到必然性的制约,以某种形式表现着相应的必然性,因此在一定条件下可以转化为必然性.站在两者辩证关系的高度分析大数定律会让学生豁然开朗.

结合下面的应用案例和数值模拟让学生进一步观察到,当n足够大时,算术平均值与其数学期望有较大偏差的可能性很小,即平均值具有稳定性.虽然少量数据中,算术平均值表现出的是不确定性、波动性、偶然性,但这种偶然性会在大数中相互抵消,逐渐呈现出必然性的规律,就是稳定性.这种偶然性向着必然性的转变是在大数中实现的,它反映了偶然性与必然性之间辩证关系,是大量随机现象中统计规律性的具体体现.

应用案例7 评委打分问题

各种竞技比赛中,需要评委打分决定参赛选手的胜负.用评委打分的平均分来衡量选手的成绩有何依据?通过学习切比雪夫大数定律,引导学生来回答这个问题.

图6 评委打分的数值模拟

7 实践效果

7.1 调查问卷反馈信息

为考查课程教学的实际效果,对2019级部分班级的358名学生进行了问卷调查.调查问卷包含15个基本问题,内容如下:

(i)你是否认为概率论与数理统计课程与实际联系很紧密?

(ii)你是否认为该课程知识内容与马克思主义唯物辩证法和方法论联系紧密?

(iii)通过学习该课程,你能否体会到事物是普遍联系的,又是相互影响、相互制约的?

(iv)通过学习该课程,你能否区分清楚哪些事件具有偶然性,哪些事件具有必然性?

(v)通过学习本课程,你是否会主动地分析事物之间的区别和联系?

(vi)通过学习本课程,你是否更习惯对多种事物进行关联和对比?

(vii)通过学习本课程,你是否意识到任何事情都要从点滴做起,逐步积累就会发生质变?

(viii)通过学习本课程,你是否不由自主地想到透过事物现象,去深入挖掘本质的要素?

(ix)在生活的各个方面,你是否会很自然地用概率论与数理统计课程中的知识去分析问题?

(x)通过本课程的学习,你是否更加坚定了马克思主义唯物辩证法的正确性及合理性?

(xi)通过本课程的学习,在面对一些问题的结果时,你是否会深究其原因,不因失败而气馁,不因成功而骄傲?是否了解了任何事情既没有无因之果,也没有无果之因?

(xii)通过本课程的学习,你认为对自己树立正确的世界观和人生观是否有帮助?

(xiii)通过本课程的学习,你认为对自己理性分析身边的问题是否有帮助?

(xiv)你对本课程的学习是否满意?

(xv)在本课程的学习过程中,你是否亲自动手,通过分析解决相关问题,验证了本课程中的部分理论,认识到实践是检验真理的唯一标准?

图7给出了学生持肯定回答的比例.可以看出,绝大部分学生对课程持有肯定态度,对该门课程满意.几乎所有同学都认为本课程的内容体现了事物是普遍联系又相互制约的,且可以区分事件的偶然性和必然性.通过对本课程的学习,绝大部分同学能够主动地对多种事物进行关联和对比,主动去分析事物之间的区别和联系,这充分表明同学们已经学会了用概率论所学知识去分析身边的问题.通过课程思政,有99%同学认为该门课程对自己树立正确的人生观价值观有帮助,而100%的同学更加坚定了马克思主义唯物辩证法的正确性.其中持肯定态度百分比最少的是:同学们是否会自觉的想到透过现象看本质这个问题,尽管绝大部分同学会去深挖本质,但还有10%的同学在这方面有所欠缺.这就表明,今后在教学中这部分应该加强,通过学生反馈去调整授课的内容,以便更好的将思政建设融入到课程中来.

7.2 实践报告——开放性大作业

以实践是检验真理的唯一标准为思想,在概率论与数理统计的教学过程中,鼓励学生亲自动手参与实践,用课堂所学理论知识研究解决生活中的随机问题.在教学过程中设置了选做的开放性大作业,学生通过寻找与课程相关的实际问题,设计建模转化为概率问题,通过查阅文献,计算机编程,团队合作等,撰写实践报告.用所学知识去解决问题,从而验证课程理论的正确性.对于这项选做作业,学生热情极高,参与度高达100%.学生评价这不仅能加深对所学知识的认识和理解,也培养了他们独立思考和解决实际问题的能力.

下以2019级同学的三份开放性作业节选为例,展示学生的创意.

(i)概率论与数理统计在分析学生体测数据中的应用,这是智能191班五位同学组队完成的大作业.为了让大学生重视身体健康,提高身体素质,学校在大学生之间开展体质健康测试.该文通过对体测数据进行分析,研究肺活量、身高、体重的关系对学生身体状况的影响.

学生在大作业中,对采集的2019级某个学院学生的体测数据,身高、体重、肺活量进行数据分析,通过绘制直方图得到它们的近似分布为正态分布,然后通过矩估计和极大似然估计方法,得到以上三个指标的均值和标准差.再用相关系数定量描述它们之间的线性关系程度,如图8所示.

(a)身高与体重的关系图 (b)体重与肺活量的关系图 (c)肺活量与身高的关系图

最后通过样本分析总体,由该学院体测数据的分析,得到整个学校2019级全体学生三项指标的相关结论.即利用区间估计方法计算得到该届学生三项指标置信度为95%的置信区间.

(ii)概率论与数理统计在压力容器爆炸安全中的应用,这是安全1901班三位同学组队完成的大作业.随着生产环境中压力容器的普遍使用,伴随而来的是压力容器爆炸事故频发.因此研究造成压力容器爆炸的变形量的统计规律,获得压力容器安全概率的置信区间是非常有意义的.

学生在大作业中研究一般的压力容器——柱形容器时,非常关心爆炸后容器爆心截面外壁的径向变形量xr.由于反应爆炸载荷的参数质量比内能em和反应材料防护能力参数切线模量ET具有一定的随机性,因此使用Monte-Carlo方法对参数进行抽样,然后通过计算得到变形量xr的随机样本.应用课堂所学知识中的正态分布、区间估计、假设检验,结合统计分析方法对柱形容器爆炸后径向变形量的不确定性进行了定量描述,给出了在一定置信度下容器安全概率的区间估计.最后对柱形容器在不同TNT爆炸当量下,100组容器径向变形量数值模拟数据进行统计分析,计算得到变形量的下限可作为衡量实验安全的判据.图9给出了学生得到的安全概率满足的关系.

图9 在置信度为1-α=0.95下,安全概率P(D)的上、下限函数图

(iii)概率论与数理统计在逸夫楼电梯规划中的应用,这是智能1903班的四位同学组队完成的大作业.学校的逸夫楼8层,共56个教室每天承载着大量的教学任务,其四部电梯负责运送学生去往不同的楼层上下课,不胜其忙,特别课间高峰期的运力明显不足.

因此学生利用所学概率论与数理统计知识,对身边司空见惯的问题展开研究.首先调查逸夫楼电梯使用的实际情况:课间15分钟高峰期约有800名学生需要使用电梯,电梯从一层出发往返一趟开关门四次(电梯只停五层以上的楼层),电梯的荷载人数为15人,因此每台电梯每趟可送15×2=30人到达目的地.然后提出研究的问题是

① 至少需要多少台电梯才能保证800名学生以95%的概率按时到达?

② 逸夫楼现有4台电梯(两台停双层,两台停单层),每台电梯至少搭载多少人才能满足上述需求?此时电梯是否超载?

下面选取部分有效数据:

表3 电梯上下楼、开关门所用时间

学生利用所学知识中的正态分布、数学期望及中心极限定理通过建模求解,成功地解决了上述问题.经计算,得到的结论是:800名学生若要在15分钟内及时到达目标楼层,需要配备6台电梯.如果只利用目前仅有的4台电梯,每台至少搭载26人才能满足上述需求,属于严重超载.

7.3 课程效果的延续——本科创新项目

通过对本课程的学习,许多同学对相关的知识内容产生很大兴趣,继续拓展学习本课程知识,延续本课程的知识并赋予实践,形成本科生创新项目.其中不乏研究成果达到了期刊论文或会议论文发表的水平[11-12].学生评价:受益于概率论与数理统计课程的学习,兴趣来自课上的思维方法和实际案例等启发以及动手能力的培养.

以下是已发表论文,用本课程及引申知识完成的两个本科生创新项目:

项目1应用贝叶斯分类模型预测大学生英语四级考试通过率.学生在课堂所学朴素贝叶斯分类方法基础上,利用加权贝叶斯分类模型对北京科技大学本科生的大学生英语四级考试通过率进行预测.通过对误判数据的分析,调整贝叶斯分类器的判别条件,通过引入“潜力因子”改进了加权贝叶斯分类模型,提高了预测结果的准确性.研究成果整理成论文,并发表在《大学数学》期刊上.

项目2基于数据挖掘算法的大学英语成绩分类方法的研究.该项目利用本科生英语学习的真实成绩,应用三种数据挖掘算法:朴素贝叶斯分类、C4.5决策树和逻辑回归方法对学生的最终英语成绩水平进行评估,并对各算法的性能和精度进行了分析比较.研究成果整理成论文(英文),并在第三届应用数学与数据科学国际会议上发表.

8 结 论

通过分析具体的应用案例,将马克思主义唯物辩证法融入概率论与数理统计课程的教学设计与教学实践,在传授知识的同时,培养学生的理性思辨能力,引导学生树立正确的人生观、价值观和世界观.在实践教学中,鼓励学生发现与本课程相关的问题,并用相关的知识解决这些问题,培养学生独立思考能力、创新思维能力及解决复杂问题的综合能力,将实现理论与实践相统一,教书与育人相统一.

致谢作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见.

猜你喜欢
贝叶斯概率课程
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
基于贝叶斯解释回应被告人讲述的故事
数字图像处理课程混合式教学改革与探索
软件设计与开发实践课程探索与实践
为什么要学习HAA课程?
基于动态贝叶斯估计的疲劳驾驶识别研究
A—Level统计课程和AP统计课程的比较