浅谈现代统计学教学中大学生数据分析能力的培养

2021-04-13 23:42许凯
课程教育研究 2021年17期
关键词:海量能力统计学

[摘要]随着大数据时代的到来,更多的人开始关注现代统计学教学中学生数据分析能力的培养。本文以大数据背景下如何提高大学生数据分析能力作为目标,分别从实现这一目标的必要性、主要内容、基本途径以及拟解决的问题四个方面进行了探讨和阐述。

[关键词]大学统计学教学数据分析能力必要性途径分析

[基金项目]安徽省质量工程教学研究项目基金(2020jyxm0649);国家自然科学项目基金(11901006);安徽省自然科学项目基金(1908085QA06)。

[中图分类号]G64

[文献标识码]A

[文章编号]2095-3089(2021)17-0147-03

一、引言

2015年9月5日中国政府网印发国务院促进大数据发展行动纲要的通知,从发展意义与形势、总的目标与思想、所面临的任务、相关政策机制四个角度阐述了大数据作为一种重要的新型国家资源,现代社会处在充满改革与急速发展的各类复杂数据时代。大数据相关文献也称为海量数据,它的主要特点可以用四个“V”去描述。第一个是数据的体量很高(Volume)即数据的维数和数据的样本量都很大;第二个是数据相依结构多样化(Variety)即包括复杂非线性相依和复杂高维;第三个是数据的稀疏值复杂(Value)即数据的变量很多但有用的变量可能很少;第四个是计算的有效性不稳定(Velocity)即由于数据的高维数和大样本量常使得传统的计算方法失效。无论发展中国家还是发达国家都愈发重视大数据技术的发展与应用,这就需要从事海量数据分析的专职人才。统计学是以数据为中心的学科,统计学的本质就是利用统计工具分析和挖掘数据所包含的有用信息。这就需要学生系统地学习概率论与数理统计的基础知识,能够从海量的数据中提取有价值的信息,并能够给出科学的决策建议和意见。随着大数据时代的到来,更多的人开始关注现代统计学教学中学生数据分析能力的培养。本文以大数据背景下如何提高大学生数据分析能力作为目标,分别从实现这一目标的必要性、主要内容、基本途径以及拟解决的问题四个方面进行了探讨和阐述。

二、现代统计学教学中提高大学生数据分析能力的迫切性和必要性

在上个世纪初期,统计学还处于描述统计阶段,没有形成公理化,人们对数据的定义和观念只是些数字,比如身高、体重、臂长等,这些数据都是被收集和被记录的阿拉伯数字所构成,而且这些传统的经典小数据的收集方法、加工方法、处理方法都与现代统计中的前沿技术有所不同。一个经典的例子就是英国著名生物学家兼统计学家高尔顿于19世纪在研究人类遗传学所提出的回归分析问题。高尔顿当年从遗传学的角度关心的是父母的身高对子女的身高有没有影响,如果有影响又该如何刻画这种影响,为此高尔顿在1877年的四月五号、十二号和十九号分别在自然期刊上提出著名的回归系数,那里的回归系数就是本科教材中的经典的皮尔逊积矩相关系数,是两个随机变量的重要数字特征,这个经典例子说明传统的数据分析技术从估计、检验和预测的角度去挖掘和刻画和数字数据有关的随机现象和问题。

然而,在现代统计学中,数据的定义和概念要宽泛了很多。只要能够被数字化的信息载体,都能够称之为数据。例如高速公路上及城市各个路口的摄像头记录的影像视频,消费者网上购物停留在网页界面的时间流量,公安系统的刑侦人员对嫌疑犯人脸头像的甄别图片,生物统计中基因组生物信息载体等等,尽管这些都不是被收集和被记录的阿拉伯数字所构成,但是它们都是数据或者说都是可以数字化的数据。特别地,这些数据相依类型复杂、数据的价值具有低密度性,当数据的容量达到一定程度后,传统的经典处理方法都会失效,掌握前沿先進的统计推断知识技能的数据分析能力就非常有必要了。另一方面,近年来随着计算机科学技术的快速提升,使得海量数据的采集、处理以及精准高速的运算都成为现实,人们步入大数据时代。在现代统计的实际应用中,经常遇到要处理高维或超大样本数据的情形,这种情形在经济、金融、生物医学、工业工程中尤为常见。

与统计学特别是现代统计学有关的高等教育培养体系目标中,应该把海量数据的处理办法、加工方法和收集技术包含进来,这些技术方法应该成为当今高等教育中学生的重要学习内容。为了使高等教育中的学生可以较快适应和具备当代统计学的海量数据的分析能力,应该把数据分析的常用技术技巧加入到相关课程中去。现代统计学教学中大学生数据分析能力的培养应该是与高等教育中学生的培养标准是一致的。由于每行每业有海量数据信息需要去挖掘和分析,因此这也一定程度上提升了学生的跨学科进行学术研究的本领。另一方面,从各个行业的需求以及发展的角度来看,适应和掌握大数据特别是海量数据学科思想是迫切的和必须的。在当今信息爆炸的时代,从来不会缺少数据,甚至无处不在,相关统计表明几乎百分之九十九的海量数据的信息都处于深度睡眠状态,需要我们去挖掘和开发。因此在新时代的大背景下,高校的学生更应该积极主动地去学习海量数据的处理技巧和统计分析软件。针对新形式的背景,经典的概率论与数理统计的传统课程已无法满足新的需求。因为这些课程都注重理论知识的传授和培养,常常忽略了统计学的学科思维,即数据思维。因为实践问题中我们拿到的数据都不是经典的,经常无法满足理想的模型假设,在这种情况下去利用标准的统计推断分析方法所得到的结论可能是错误的,甚至是不可信的。这就要求高校学生应积极主动学习海量数据思维,特别是当已有模型都无法适应新的数据的时候该如何解决。另外,传统的统计学教育主要关注学生的考试能力,这种以考试成绩为目标的培养是不利于学生的数据分析能力的培养的。因此,为了培养出能够适应和胜任海量数据分析能力的高等教育人才,就必须也很有必要对现有的课程体系进行相关的革新。

三、现代统计学教学中提高大学生数据分析能力的主要内容

(一)构建教学内容课程体系

海量数据的信息提取必须具有一定的理论基础,从而线性代数、高等数学、概率论与数理统计等课程是必修的。而过分强调理论会使得高校学生的数据思维被扼杀掉,因此高校应该开设一些数据挖掘,机器学习和人工智能的课程,这些课程应该包含与数据分析特别是海量数据分析有关的无监督学习如大数据降维、向前回归和向后回归、特征筛选、变量筛选等;半监督学习如聚类分析、因子分析、主成分分析等;有监督学习如回归分析、方差分析等。

(二)课程案例教学设计研究

经典和优秀的案例分析不仅能够加强课程的实践性,还能提升课程的趣味性。海量数据分析经典案例有很多,比如文本分析、基因路径分析、数据可视化分析等。把这些优秀例子结合统计学理论进行讲授,不仅可以开发学生的数据思维,还能触通旁类,启发学生横向学习和纵向学习的跨学科学习能力。让学生如何在数据案例中学习理论,学以致用。

(三)课程实践教学环节研究

经典的教学课程首先向学生呈现的是数学公式,然后把数据当作数字导入公式计算,然后对所得计算结果进行统计解释。这样做完全违背了统计学的学科发展过程,统计学首先是从描述统计开始,刚开始只有实际问题没有任何理论背景,直到前苏联的著名数学和统计学家安德雷·尼古拉耶维奇·柯尔莫哥洛夫从测度论角度把统计学进行公理化才有概率论与数理统计这门学科。因此,在教学实践环节,应该从数据出发,摒弃相关理论,侧重统计软件的运用,有目的地、有组织地展开能够为学生提升数据思维的环境。

四、现代统计学教学中提高大学生數据分析能力的基本途径

(一)统计理论和案例应用相结合

以理论为基础侧重统计知识的应用,开展海量数据分析方法,基于统计分析软件,结合海量数据处理技术,提升高校大学生的数据分析思维。近几年来,统计建模大赛受到学校和各级部门的高度重视,作为创新创业大赛的一部分和培养创新型人才的重要手段之一,有利于高校学生利用统计计算软件解决实际问题的本领,特别是统计模型的建立和统计方法的运用。进一步有利于培养学生的创新思维和提高他们的应用知识的水平。特别是伴随着大数据时代的来临,重大的变化需求也发生在各行各业对现代统计学高质量人才的要求,这对与统计学相关的高等教育提出新的要求和挑战。应该积极鼓励学生参加各类统计和数学建模,通过对统计建模课程教学现状的调查分析,确定统计建模课程改革的指导思想,探讨课程内容体系和教学内容体系的构建,提出实践性教学环节的实施模式,对大数据时代背景下统计建模教学方法进行探索与实践。

(二)课程教学和上机实践相结合

结合课程教学,我们安排上机实践课程以提高学生的统计软件能力。运用软件进行大数据分析,调用函数、编写复杂程序、仿真、模拟实验等。运用软件对统计理论进行验证。一方面提高学生统计软件的应用能力,另一方面加深学生对统计理论的理解。进一步布置较为开放性的命题,将学生分成若干组,要求结合自己的专业查找有关资料和大数据,然后利用软件完成相关的统计分析。结合各组上交的作业情况和各组讲解作业完成思路的表现综合打分。

(三)教师的教研和科研项目与教学相结合

任课教师应该积极主动开展和教学、教研有关的科学研究,并积极主动申请相关项目,并把学生以参与人的方式加入到项目中去。从实际问题出发,和学生一起以合作方式完成相关项目包括论文的撰写。从数据的收集处理、模型的建立、模型假设的验证、数据分析结果的解释说明等内容,能使学生在一个项目中得到收获激发他们的兴趣爱好。

五、现代统计学教学中提高大学生数据分析能力过程中拟解决的问题

(一)课程体系和教学内容体系的构建问题:经典的数理统计类课程不能将所学知识与专业研究有机地联系起来。在大数据驱动下新课程在教学内容设计上注重理论学习与实践有机结合,并凸显数据建模的实践应用价值,提升统计建模人才的综合性技能。

(二)开展实践教学的可行性:从学生的发展和需求及课程本身出发,结合我校实际情况,从实践教学的硬件和软件,如大数据实验室、教学观念、师资团队、实践课程体系设置、数据来源等方面探讨新课程实践教学的可行性。

(三)适合多层次统计应用型人才培养平台的搭建问题:大数据时代人才的培养需要多方主体的参与,不仅需要具有专业知识的高校,还需要具有熟练实践知识的政界和企业界,三方交流合作才能培养出适合多层次的统计应用型人才,高校与政府、高校与企业进行多方合作的方式及可操作性问题是需要解决的关键问题之一。在我们的研究团队中已有关注生物大数据应用的业界人员,这为我们解决这一关键问题提供了契机。

六、结语

综上所述,当今的教育体制下学生数据分析能力的培养已经涉及到不同学科。作为一名高校统计学教育教学工作者,应该积极主动地发现自身存在的不足,提出了制定适合信息与统计科学专业学生的数理统计课程大纲、实验大纲和实验指导书,编写具有时代特色的数理统计教材,增加计算机实验课程,加强案例教学和项目教学,建设网络课程,改革考核方式等解决办法,激发学生的学习兴趣,提高学生的数据分析能力,适应大数据时代发展的要求,为国家和社会发展输送更多高素质应用和学术型的人才,积极探索新型的教学手段和教育方法。

参考文献:

[1]国务院关于印发促进大数据发展行动纲要的通知[R],中国政府网,2015-09-05.

[2]孟生旺,袁卫.大数据时代的统计教育J统计研究,2015.

[3]朱力平大数据面前,统计学的价值在哪里N光明日报,2019-03-30.

作者简介:

许凯(1988年10月-),男,博士,副教授,主要从事统计推断及课程教学方面的研究工作。

猜你喜欢
海量能力统计学
关于投稿的统计学要求
消防安全四个能力
一种傅里叶域海量数据高速谱聚类方法
统计学符号使用的说明
统计学符号使用的说明
本刊对来稿中统计学处理的有关要求
海量快递垃圾正在“围城”——“绿色快递”势在必行
大兴学习之风 提升履职能力
你的换位思考能力如何
基于文件系统的分布式海量空间数据高效存储与组织研究