贝叶斯公式中的课程思政教学设计

2022-05-07 02:46玄祖兴张立新袁安锋
大学数学 2022年2期
关键词:流水线贝叶斯概率

玄祖兴, 张立新, 袁安锋

(北京联合大学 数理部,北京100101)

1 引 言

认真学习习近平总书记在全国高校思想政治工作会议上的讲话,以及2018年全国高等学校本科教育工作会议上提出的“高校要明确所有课程的育人要素和责任,推动每一位专业课老师制定开展‘课程思政’教学设计,做到课程门门有思政,教师人人讲育人”的要求,各高校教师结合概率论与数理统计这门课程的特点,开展课程思政教学研究与实践[1].

在备课时,深入挖掘概率论与数理统计知识中的数学文化、科学思维方法、辩证唯物主义思想,结合具体教学内容,将社会主义核心价值观、实现民族复兴的责任和担当、做人做事的基本道理有机融入到概念、公式及其推导和应用中.

有些学者对贝叶斯公式进行了教学设计和研究[2-3],而涉及到课程思政的较少.在对贝叶斯公式这节进行课程思政教学设计时,融入的思政元素有:对数据进行科学的分析和决策,不能想当然;贝叶斯的生平事迹;在疾病谣言面前,做到不信谣,不传谣,要相信科学;懂得做人要守诚信的道理.

2 课程思政教学设计思路

教学中合理使用问题驱动式教学、启发式教学、案例教学、互动教学等方法,引导学生积极、主动地参与到课堂教学当中.以兴趣为导向探寻真理,理清知识的来龙去脉.以解决问题为主线,将知识关联起来,创新理论推导过程,公式推理更为形象化,学生能够抓住理论的关键点(精髓),易于教师的“教”与学生的“学”;教学内容体现学科的发展前沿,开阔学生的视野,做到讲解深入浅出与激发学生学习兴趣并重,提高课堂教学效果;适当引入数学史,使学生了解学科的发展、公式与定理发现的过程和数学家的故事等,增近学生与所学内容的距离,教育学生相信科学,鼓励其探索科学真理.下面从教学目标、教学重点和难点、讲解思路等方面融入课程思政元素进行教学设计.

2.1 教学目标

2.1.1 知识目标 掌握贝叶斯公式的具体形式;会正确使用贝叶斯公式解决实际问题;理解贝叶斯公式的本质——条件概率的反问题;掌握先验概率与后验概率的关系.

2.1.2 能力目标 通过对“流水线问题”的分析,引导学生积极主动探索贝叶斯公式的具体形式,培养学生分析问题和解决问题的能力;通过对“疾病诊断问题”的讲解,培养学生严密的逻辑推理能力和抽象思维能力,达到学生掌握运用数学符号语言的目的;通过“三门问题”的讲解说明在做基于量化的判断时,不仅要用现代逻辑方法拓展归纳逻辑的研究,还要借鉴认知科学的研究成果,以事实和数据为依据,向学生宣传科学知识;学生学会从贝叶斯公式出发思考多层贝叶斯公式,提高学生运用所学知识去研究更为复杂问题的能力.

2.1.3 育人目标 通过贝叶斯公式在生活中的应用培养学生学以致用的意识;通过流水线问题让学生养成对数据进行科学分析和决策的习惯;通过“疾病诊断问题”让学生相信科学,不信谣不传谣;通过揭示贝叶斯公式的本质及分析先验概率和后验概率的关系让学生进一步体会数学中的辩证思想;通过“狼来了”的故事让学生建立诚信模型,做人要讲诚信.

2.2 教学重点和难点

2.2.1 教学重点 先验概率和后验概率的含义;贝叶斯公式的本质;正反概率问题的求解思路,培养学生的逆向思维能力.

2.2.2 教学难点 引导学生从反问题的角度出发得到贝叶斯公式;学生自然理解先验概率和后验概率的本质,进而理解贝叶斯公式的本质;教会学生应用贝叶斯公式解决具体问题.

2.3 讲解思路

采用“问题—理论—问题”的思路,具体如下:

问题的提出——通过“流水线问题”提出问题,导入新课

(思政元素:对数据进行科学的分析和决策,不能想当然)

确定次品来自每条流水线的概率——假设出变量,运用数学建模的方法解答问题

贝叶斯公式——通过回顾条件概率、乘法公式及全概率公式推导出贝叶斯公式

(思政元素:由先验概率和后验概率的关系体会数学中的辩证思想、数学史)

公式的应用——通过讲解“疾病诊断问题”“三门问题”加深对公式的理解

(思政元素:在疾病谣言面前,做到不信谣,不传谣,让学生相信科学)

贝叶斯公式的拓展——抓住问题的本质进行知识拓宽,引导学生进行自主、创新学习

(思政元素:建立诚信模型,懂得做人要讲诚信)

3 教学过程

3.1 提出问题,引发兴趣

贝叶斯公式是概率论课程中的重要公式之一,同时也是贝叶斯统计的核心和理论基础,在金融、医疗、工程、互联网等诸多领域中都有着许多重要的实际应用价值.先看一个具体问题.

某汽车厂有三条流水线生产同一款汽车,各项数据见表1.

表1 流水线生产情况

该汽车厂设有专门的质量检测部门,定期对产品进行检测.有一天他们抽到了一件次品,问:它来自哪一条流水线的可能性最大呢?

通过与学生互动,多数学生会凭借直观感觉回答来自第三条流水线的可能性最大.那么事实果真如此吗?如果真是这样,那么其余5个数据又有何用呢?为此接下来对该问题进行分析,画出思维导图并给出解释.

图1 流水线问题思维导图1

三条流水线生产同一款汽车,而且都可能产生次品.把产品来自三条流水线认为是产生次品的各个原因,把产品为次品当成结果,并且把原因和结果用事件表达出来,则求产品为次品的概率可以认为是从原因到结果(即“执因寻果”)的过程,可以用全概率公式.

现在把问题的思路转换一下:已知产品为次品这一结果发生了,求它来自哪一条流水线的可能性最大.也就是知道结果来探寻原因,形象的说就是“执果寻因”的过程.即在事件A(结果)发生的条件下,求B1,B2,B3(原因)发生的概率(图2),这样,就把问题归结为求条件概率的问题了.

图2 流水线问题思维导图2

再来看表1中的两组数据,左侧是流水线产量的份额,指的是B1,B2,B3发生的概率,右侧为三条流水线各自产生次品的概率,这是条件概率.用概率语言将这两组数据表达出来并进行求解.

设A为“取出的一件产品是次品”,Bi为“取出的产品来自第i条流水线”,i=1,2,3.由题意知,P(B1)=0.46,P(B2)=0.33,P(B3)=0.21,P(A|B1)=0.015,P(A|B2)=0.025,P(A|B3)=0.035.从而

由S=B1∪B2∪B3,BkBl=∅(k≠l;k,l=1,2,3),表明B1,B2,B3为样本空间S的一个划分,根据全概率公式得

同理可得

通过上面的计算可知,该次品来自第二条流水线的可能性最大.这与刚才直观感觉是有所差异的,启示我们在面对问题时要对数据进行科学的分析和决策,不能想当然.

3.2 抽象概括,引出公式

把上面解决问题的思想方法一般化、抽象化,就得到贝叶斯公式.

设试验E的样本空间为S,A为E的事件,B1,B2,…,Bn为样本空间S的一个划分,且P(A)>0, P(Bi)>0(i=1,2,…,n),则有

综合使用条件概率公式、乘法公式、全概率公式就可以证明贝叶斯公式.

借助下述框图帮助学生理解贝叶斯公式.

图3 贝叶斯公式框图

公式中的两个重要的量,一是先验概率(P(Bi)),在没有进一步信息(即不知道事件A是否发生)的条件下,研究者对划分中各个事件Bi(i=1,2,…,n)概率的理解和判断,该类数值不是根据有关自然状态的全部资料测定的,而只是利用现有的材料(主要是历史资料)计算得到;二是后验概率(P(Bi|A)):基于新的信息(即试验结果A出现),对事件Bi进行重新评估和调整后算出的发生概率,更接近实际情况的概率估计,这种修正可以一次一次的进行,其中量化的工具就是贝叶斯公式.后验概率的本质是条件概率的反问题,贝叶斯公式又称为逆概率公式,它是从先验概率P(Bi)到后验概率P(Bi|A)的转化公式,也是从条件概率P(A|Bi)到P(Bi|A)的转化公式.

讲完贝叶斯公式之后,介绍一下贝叶斯的生平事迹,让学生了解贝叶斯公式的发展历史,激发学生的学习兴趣.贝叶斯将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对统计决策函数、统计推断、统计的估算等做出了贡献.1763年由Richard Price(普莱斯)整理发表了贝叶斯的成果《An Essay Towards Solving a Problem in the Doctrine of Chances(机遇理论中一个问题的解)》,提出了一种归纳推理的理论,其中的“贝叶斯定理(或贝叶斯公式)”,可以看作最早的一种统计推断程序,后来的许多研究者将其发展为一种系统的统计推断方法,称为贝叶斯方法[4].

3.3 应用理论,联系实际

(i)疾病诊断问题:中国肝癌的发病率为0.00026,患者对一种试验反应为阳性(一般从医学角度说,阳性,代表有病或者有病毒;阴性,代表正常)的概率为0.98,正常人对这种试验反应为阳性的概率为0.002,现随机抽查了一个人进行试验,结果是阳性.问此人患有肝癌的概率是多少?

先分析问题画思维导图,见图4.

图4 疾病诊断问题思维导图

本问题是已知结果已发生,来探究原因,符合“执果寻因”的过程,可以利用贝叶斯公式加以解决.

解记A:试验结果是阳性,C:抽查的人患有肝癌,本题即求P(C|A).

由条件知

根据贝叶斯公式,得

即此人患有肝癌的概率是0.11303.

以EPSON Stylus Pro7910c为喷墨打印设备,对4种喷墨打印纸打印GATF标准色块,用QEA图像分析仪测试青色油墨网点的平均直径。

这组数据告诉我们什么样的信息呢?接下来,进行层层分析.

深入分析1:

本题中的先验概率P(C)=0.00026是试验前依据临床资料统计而得出的,而后验概率P(C|A)=0.11303是试验后出现了阳性后对疾病患病率的重新认识.

深入分析2:

如果在复查时仍然呈阳性,其余条件保持不变,再次利用贝叶斯公式

此人患有肝癌的概率增加到98.2%,医学上认为此人患有肝癌,需要进一步治疗.

这就启示我们往往在易感人群,也就是发病率较高的人群当中进行检测,而不是在所有人群中进行普查.

深入分析3:

把题目修改一下,如果试验结果是阴性,其余条件不变,由贝叶斯公式得

医学上,可以认为此人没有患肝癌.这也是为什么在体检的时候,对阴性的检查项目可以忽略不计的原因所在.

最后,如果把发病率由0.00026降低到0.000026,其余条件保持不变,进行如下对比分析.

深入分析4:

如果发病率继续降低,可以计算得到此人患有肝癌的概率也相应的逐渐降低.

通过对该问题的层层分析启发,引起学生的求知欲,同时告诉学生,越是罕见的疾病越不可怕,也告诉我们在疾病谣言面前,做到不信谣,不传谣,让学生相信科学.

图5 三门问题

(ii)三门问题 三门问题(Monty Hall problem)也称为蒙提霍尔问题或蒙提霍尔悖论,大致出自美国的电视游戏节目:“Let’s Make a Deal”.问题名字来自该节目的主持人蒙提·霍尔(Monty Hall).

参赛者面对三扇关闭着的门,其中只有一扇是正确的门,打开后能获得一辆汽车.另两扇门是错误选项,门内只有山羊. 现参赛者选定了1号门,但未去开启它的时候,节目主持人打开3号门,露出其中一只山羊后,主持人问参赛者要不要换成2号门.换成另外一扇门能增加参赛者赢得汽车的概率吗?

可以用贝叶斯公式来求解.

解记A: 主持人打开3号门,记Bi: 汽车在第i号门后,i=1,2,3.根据题意,

根据贝叶斯公式,得

三门问题是一个理性选择和机遇博弈问题,是关于不完全信息博弈中如何正确理解概率的含义和概率变化的问题.这是一个人的直觉和概率论不太相符的例子,说明在做基于量化的判断时,不仅要用现代逻辑的方法来拓展归纳逻辑的研究,而且要借鉴认知科学的研究成果,以事实和数据为依据.对已有的知识和信念应该保持谨慎而谦逊的态度,它不是百分之百确定的.在新证据面前,我们不必完全丢弃已有的知识,但要根据新的信息来调整自己的思考.

生活中随处可见贝叶斯公式的踪迹,它主要有两方面的作用.首先它可以帮助寻找导致结果A发生的最可能的原因,是通过计算条件概率P(Bi|A)来实现的.比如,影响大学排名的因素有师资力量、科研水平、人才培养、就业率、财政资源等.再比如,影响股票价格的因素有国家政策、上市公司业绩、消息、经济水平、物价水平等.贝叶斯公式的第二个应用是它提供了从先验概率到后验概率修正的方法,这是贝叶斯统计的核心点.

3.4 知识拓展,课后思考

3.4.1 信号编码解码 研究信号的编码、传输与解码过程,已知发射端等可能的发射1和0,传输中出错的概率分别为0.1和0.15.讨论(i)编码和解码都不出错;(ii)编码不出错,1和0解码出错的概率分别为0.07和0.1;(iii)编码出错,1和0出错的概率分别为0.05和0.04不同情况下,问接收到1时,如何判断发射的到底是0还是1呢?[5]

编码是否出错和传输是否出错都可看成是样本空间的划分.通过信息编码解码问题,启发学生思考,通过类比的方法引出多层贝叶斯公式,培养学生发现知识的能力.

将多层贝叶斯公式以可视化的图形表达出来,就会得到贝叶斯网络(因网络中每个节点的概率都可以用贝叶斯公式来计算而得名,也被称为信念网络),由 Judea Pearl教授(美国)于1986年提出,多用于专家系统,成为不确定知识和推理问题的流行方法,已成功地用于医疗诊断、统计决策、图像处理、博弈论、学习预测、转接系统等领域.

贝叶斯理论的应用领域很广泛.数学领域:贝叶斯公式应用于概率空间;贝叶斯分类算法应用于统计分析、测绘学;贝叶斯估计应用于参数估计;贝叶斯区间估计应用于数学中的区间估计;贝叶斯风险、贝叶斯统计、贝叶斯序贯决策函数、经验贝叶斯方法应用于统计决策论.工程领域:贝叶斯定理应用于人工智能、心理学、遗传学;贝叶斯分类器应用于模式识别、人工智能,贝叶斯分析应用于计算机科学;贝叶斯决策、贝叶斯逻辑应用于人工智能;贝叶斯推理应用于数量地理学、人工智能;贝叶斯学习应用于模式识别.其他领域:贝叶斯主义应用于自然辩证法;有信息的贝叶斯决策方法应用于生态系统生态学.

3.4.2 课后思考 请同学们以“狼来了”的故事为背景,建立数学模型来讨论小孩撒谎后的可信度变化情况,进而建立诚信模型.

孔子说:“人而无信,不可知其也.”诚信是社会主义核心价值观的重要组成部分,通过这个故事让学生懂得做人要讲诚信的道理.

4 教学效果

新的教学设计已经经过了四个学期的教学实践.课题组在每学期结束时都开展课程问卷调查,问卷表明了学生分析问题的能力得到提高.对于贝叶斯公式这个知识点,学生能够灵活运用贝叶斯公式解决难度适中的实际问题,尤其是疾病诊断这种实际问题,引导学生用数据说话,相信科学.

通过近四个学期的期末考试中贝叶斯公式题目学生的得分情况对比发现,新的教学设计更容易让学生掌握知识点.下面是贝叶斯公式题目(10分)学生的平均得分情况(图6):

图6 平均得分柱状图

通过对本课程其他知识点相同的教学设计,学生的学习热情和综合素质得到了有效提升,成效显著.学生学期平均到课率高达97.5%,抬头率、参与率明显提升,课堂气氛更加活跃,学习数学的积极性明显提高.学生在数学竞赛、数学建模竞赛等省部级及以上比赛中年均获得奖项40余项.学生参与项目课题意愿强烈,创新创业中的数学方法运用娴熟,创新意识与实践能力等综合素质明显提升.从近两年来毕业生跟踪调查数据来看,毕业生反馈高校数学课程在促进工作能力提升、创思维能力养成的贡献度为“非常高”.

5 结 论

贝叶斯公式的教学中融入数学建模的思想和方法,搭建起理论和实践应用的桥梁.通过精心设计实例——流水线问题,更容易与学生互动,借助直观的理解引导学生将问题当中的各个变量假设出来,运用相关理论刻画出定量关系,从而解决问题.这样处理能做到理论联系实际,在传授知识的同时,学生明白了“学以致用”的道理,既能很好地理解枯燥难懂的定理公式,又能感受到概率的美无处不在.逐步搭建起理论和实践应用的桥梁,激发其投身专业学习的兴趣.然后将解决上述问题的思路、方法一般化,由特殊到一般,得到贝叶斯公式,并理解公式的本质.最后结合贝叶斯公式在现实生活和科学研究中的实际应用,提升学生发现知识的能力,激发学生探究新知识、新领域的兴趣.

在教学中教师要牢固树立育人意识,把思想价值引领贯穿于教学全过程和各环节.深入挖掘和充实思想政治教育资源,精心设计教学方案,自觉将“课程思政”融入到课堂教学中,达到春风化雨、润物无声的效果.

致谢作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见.

猜你喜欢
流水线贝叶斯概率
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
基于贝叶斯解释回应被告人讲述的故事
流水线
基于PLC的饮料灌装流水线设计
基于动态贝叶斯估计的疲劳驾驶识别研究
流水线
基于互信息的贝叶斯网络结构学习