大数据背景下《数据挖掘理论》课程教学思考

2018-12-05 09:06
现代商贸工业 2018年20期
关键词:数据挖掘教学方式课程

王 洪 洪 铃

(中南大学数学与统计学院,湖南 长沙 410083)

1 引言

《数据挖掘理论》是我校面向数学、统计、应用统计类研究生专业普遍开设的课程,也是全国大部分高校研究生阶段的核心或选修课程。互联网和计算机领域的快速发展带来了各行业数据的指数式增长,联合国2012年发布了大数据白皮书“Big Data for Development:Challenges & Opportunities”并指出,大数据时代已经到来,大数据的出现将会对社会各个领域产生深刻影响。因此,对于长期与大数据打交道的研究生来说,数据挖掘课程的学习尤为重要。其不仅为其他课程的学习提供了引导,也会影响学生对研究生阶段的其它专业课的学习热情,甚至会直接影响学生毕业设计的选题。项贤明指出教师应当通过具体的案例分析,在新的情境中根据实际情况进行教育创新,而不是照搬别人的经验和方法。只有这样,才能抓住教育创新与改革的精神和灵魂。笔者在借鉴近年来教育改革的成功经验的基础上,根据自己讲授《数据挖掘理论》课程的教学实践总结,结合数据挖掘课程的特点以及大数据的时代背景,对数据挖掘理课程的教学进行了思考与探究,以期望能够提高教学水平和质量,促进教育改革与教育创新,并培养出更多优秀的数据挖掘人才。

2 数据挖掘的学科特点

要对《数据挖掘理论》等数据挖掘课程进行教学改革以提高教学质量,首先得了解数据挖掘课程的特点,才能对症下药。

数据挖掘具有以下几个特点:

(1)新颖性。大数据时代的到来,数据挖掘在各行业、各领域受到广泛应用,国内外关于数据挖掘技术的研究不断增加、成果越来越丰富。

(2)覆盖内容广。数据挖掘的任务包括分类、回归、聚类和关联规则挖掘等多方面的内容,每部分内容都有特定的数据挖掘技术与算法。所以在教学实践中,应该有所选择和侧重地讲授。

(3)交叉性。数据挖掘是一门交叉性学科,其融合了人工智能、数据库技术、模式识别、机器学习、统计学和数据可视化等多个领域的理论和技术。

(4)难度大。其新颖性、覆盖内容广、交叉性等特点就决定了其有较大的难度,所以该课程要求学生必须具备扎实的数学分析、代数、概率论及统计学基础知识,这也是为什么选择面向研究生开设本课程的原因。

3 教学实践中存在的问题

笔者根据自己的《数据挖掘理论》课程的教学实践以及有关调研资料,总结了目前教学实践中存在的问题,具体内容如下:

(1) 教材种类、内容繁多。

市面上数据挖掘课程教材种类繁多,包括外文翻译来的和国内学者写的,但是有相当一部分内容比较空泛。有些外文翻译的教材存在句子不通顺、逻辑性不强、专业术语缺乏解释等问题,影响学生对内容的准确理解。许多教材内容覆盖面广、章节繁多,甚至写成了百科全书,涉及到数据可视化、统计学、算法等多学科内容,大部分内容只是简单介绍原理,并不提供具体的例子与操作,像神经网络等较难知识点写的晦涩难懂,许多学生反映无法清晰的掌握数据挖掘的知识框架。

(2) 教学形式单一。

目前,大部分高校采取传统的老师教、学生学的单向“满堂灌”教学模式,单一而呆板,学生被动的接受知识,缺乏广泛参与,独立思考的能力得不到锻炼,学习积极性得不到提高,所学内容不能得到很好的消化与应用。

(3) 理论与实践脱节。

数据挖掘是一门具有较强理论性和实践性的学科,理论知识与计算机操作联系紧密。任何一门信息类课程都应以改变学生的学习思维,即将人的思维转变为计算机的思维,为主要目的。但大部分高校教师都偏重理论知识的教学,很少谈及到算法设计、程序编写等内容,教学枯燥而无味,学生既无法集中精力学习理论,也不能将所学到的知识应用于实际,达不到课程开设的初衷。

4 教学改革思考与探究

数据挖掘作为面向数学、统计、应用统计类研究生专业开设的课程,更应该着重培养研究生运用知识解决实际问题的能力。因此,其教学目标是:使学生树立数据挖掘的思维体系,掌握基本的挖掘技术,熟练运用至少一类数据挖掘软件,如R、SAS、Matlab、python等;能够根据实际问题,制定一个合理、完整的数据挖掘计划,通过建立模型、进行评估以及可视化结果,达到解决问题的目的。根据该教学目标,我们从教学内容、教学方式以及考核方式三个方面进行改革与探究。

4.1 优化教学内容

首先,授课教师要构建数据挖掘课程相对完整的知识体系,包括数据预处理、数据挖掘方法(分类、回归、聚类、关联分析等)、数据挖掘软件平台及工具、数据挖掘的支撑技术、复杂结构数据挖掘与数据流挖掘、数据挖掘的应用、数据挖掘领域的前沿和发展趋势(云计算、并行计算、深度学习等),弥补现有教材的不足,让学生对该课程有一个宏观概念,充分了解该课程的实用性,激起学生的学习热情和兴趣。

钱峰认为软件是数据挖掘的必备工具。数据挖掘课程是一门理论与实践相结合的课程,又加上理论部分晦涩难懂,很多算法对于没有计算机基础的学生来说掌握起来比较困难,目前国内数据挖掘工具可非分:基于DOS的软件工具、基于Windows的软件工具、基于Linux的软件工具和基于Solaris的软件工具。所以教师应在课堂上选定一种界面友好、易于掌握的数据挖掘软件(如R、python等),结合案例教学法针对具体的数据集进行现场编程并不断调试,让学生眼见为实,明白数据挖掘是一门实用性课程及其对数据处理的意义,提高学生对该课程的兴趣。

鉴于数据挖掘内容繁多,仅在一个学期的时间内无法要求学生掌握全部知识,所以重点介绍比较常用、计算机能够操作的方法,比如,数据可视化、决策树、随机森林、支持向量机、K近邻、神经网络、关联规则分析等。此外,不仅要对现有陈旧内容进行更新,还要增加和大数据有关的内容,使学生掌握系统知识的同时,了解国际上最新的研究动态与研究成果,明确数据挖掘的未来发展前景和趋势。例如,在课堂最后增加了如“大数据挖掘之MapReduce”、专门用于解决未标记数据的“半监督学习”、“深度学习”等现行教材中均未出现的内容。此外,笔者邀请所在单位多名优秀博士生在课堂上介绍自己的最新成果,这些都引起学生的高度兴趣,并引导学生向优秀的师哥师姐学习。授课教师要向学生传输这样的信息:世界在不断进步,数据挖掘也在不断发展,涉及的领域不断拓展;课堂传授的知识只是数据挖掘的一部分内容。同时,授课教师要鼓励学生自主学习课外知识。

4.2 改进课堂教学方式

在课堂教学方式上,大部分高校的数据挖掘课程普遍存在传统的老师教、学生学的单向“满堂灌”教学模式,单一而呆板,教学过程中学生与老师发生脱节,缺乏充分的讨论与交流。针对这些问题,笔者提出了“参与型”、“辩论型”教学与基于MOOC的教学方式。

4.2.1 进行“参与型”、“辩论型”教学

为了更好的鼓励学生学习课外知识,在课堂教学方式方面,我们进行了“参与型”、“辩论型”教学尝试。授课教师引导学生在课后对自己或导师感兴趣的某一个专题或方法进行文献搜集,资料整理,并在课堂上开展学术讲座,让学生进行汇报,时间每人不少于30分钟。这种方式使学生更多地参与到教学活动中,培养了学生主动学习、独立思考、大胆创新、准确表达、有效沟通的能力。参与本课程学习的大部分学生表示:自己的分析能力、创新能力和研究能力、合作与沟通能力得到了很好的提高。

4.2.2 基于MOOC的教学方式

唐汉卫提出多样化、个性化已成为近年来教育改革的重要趋势。为了完善研讨型教学方式,更好地满足学生的个性化学习需求,笔者建议在条件允许的前提下增加MOOC教学方式(大型开放式网络课程)。在借鉴其他学者基于MOOC的翻转课堂研究和MOOC学习者个性化模型构建的基础上,结合学生实际情况制定具有自身特色的MOOC教学方式。

考虑到MOOC课程资源可能与所在高校开设课程内容不一致、学生外语水平参差不齐、国内外文化差异等种种因素,笔者将每节课的学习过程分为课前、课中、课后三个阶段。授课教师在每次讲课三天前将MOOC课程资源提供给学生,保证他们课前有充足的时间自主学习该内容,对于某些MOOC课程里没有涉及到的知识点由授课教师自己制作视频并将资源提供给学生;课中,授课教师首先针对学生观看MOOC视频自主学习后的反馈,采取课堂讨论的方式,交流并解决学生在观看视频过程中遇到的疑问,然后结合课本对知识点进行系统性地讲解,一方面能够让学生重温自学内容,另一方面能够让学生清晰的知道自己在观看视频的过程中忽略了哪些知识点以及自学过程中存在的问题,以便在接下来的自主学习不断提高学习质量;课后,学生按照授课教师布置的学习任务,结合自己的学习进度和学习方式自主学习。

这样的创新授课方式不仅让学生能够独立地思考,而且能够主动地参与到“教”与“学”的过程中,提高学习积极性和学习效率。同时,授课教师也可以通过自制的视频不断进行教学反思,从而提升教学效果,促进自身科研的进步。

4.3 创新考核方式

为了更好地注重研究生平时学习能力的培养和创新能力的培养,采用多层次的考核方式,将课堂出勤、个人学术讲座和期末课程设计等进行综合评定,给出研究生的最终课程成绩。如在本单位数据挖掘课程开始之初,笔者就公布了如下考核方式:出勤率占20%、个人学术讲座或汇报占40%,期末课程设计占40%。传统的考核方式一般只看期末考试的卷面成绩,片面而又单一,不能对学生进行全面的考核。笔者所采用的多层次考核方式能够克服传统考核方式的不足,对学生多方面的能力进行综合评价,更加公正、公平,深受学生的欢迎。

很多同学为学术讲座进行了精心准备,甚至还有同学自带设备增强讲座的效果,同学们的《单层神经网络》、《Extreme Learning Machine》、《高斯型过程》等报告等引起了同学们的高度关注;很多同学的课程设计,如《SVM分类器的扩展》、《影响耐用消费品的因素地理位置统计分析》等稍加整理就是一篇比较好的学术论文。实践表明,多层次考核方式不仅对学生的动手能力进行了考核,也对学生的专业素质进行考核,同时,还能增强学生进行科研创作的能力。

5 总结

随着大数据的迅速延伸,数据挖掘的应用领域不断扩展,尤其在电子商务、生物医学、物联网、体育等领域的应用越来越多。所以,必须加快数据挖掘课程教学改革使其能够跟上数据挖掘技术快速发展的步伐。本文在分析数据挖掘学科特点的基础上,结合当前数据挖掘教学存在的问题,有针对性的从教学内容、教学方式、考核方式等方面进行改革,创造性地提出了基于MOOC的教学方式、多层次的考核方式等。教学实践结果证明,不仅提高学生的学习积极性,还锻炼其自主学习与独立思考的能力,软件操作与科研创作的能力也得到了很大的提升。总之,高校教师应该不断总结经验、调整教学方式,培养出更多优秀的数据挖掘人才。

[1] Big Data for Development:Challenges & Opportunities [DB/OL].http://www.unglobalpulse.org/sites/default/files/Big-DataforDevelopment-UNGlobalpulseJune2012.pdf,2012-05-01.

[2] 项贤明.论教育创新与教育改革[J].高等教育研究,2007,(12):1-7.

[3] 孙绵涛.当代中国教育改革的基本经验[J].现代教育管理,2015,(04):1-10.

[4] 詹少强.大数据背景下的数据挖掘课程教学新探[J].长春教育学院学报,2014,30(22):81-82.

[5] 王光宏,蒋平.数据挖掘综述[J].同济大学学报(自然科学版),2004,(02):246-252.

[6] 黄岚.数据挖掘课程实践教学资源库建设[J].计算机教育, 2014,(12):89-92.

[7] 杜卓明.《数据仓库与数据挖掘》课程教学实践与教学改革探索[J].科技视界,2014,(28):86+135.

[8] 刘云霞.统计学专业本科生开设“数据挖掘”课程的探讨[J].吉林工程技术师范学院学报,2010,26(06):20-22.

[9] 安璐,欧孟花,李纲.数据挖掘课程的知识体系构建[J].图书情报知识,2016,(05):4-12.

[10]钱峰.国内数据挖掘工具研究综述[J].情报杂志,2008,(10):11-13.

[11]周森鑫,盛鹏飞,王夫芹.数据挖掘课程案例教学研究[J].计算机技术与发展,2012,22(11):183-186.

[12]赵丹群.数据挖掘:原理、方法及其应用[J].现代图书情报技术,2000,(06):41-44.

[13]宋杰,孙宗哲,毛克明,鲍玉斌,于戈.MapReduce大数据处理平台与算法研究进展[J].软件学报,2017,28(03):514-543.

[14]黄斌,许舒人,蒲卫.基于MapReduce的数据挖掘平台设计与实现[J].计算机工程与设计,2013,34(02):495-501.

[15]唐汉卫.论教育改革的逻辑[J].教育研究,2011,32(10):11-15.

[16]曾明星,周清平,蔡国民,王晓波,陈生萍,黄云,董坚峰.基于MOOC的翻转课堂教学模式研究[J].中国电化育,2015,(04):102-108.

[17]杨玉芹.MOOC学习者个性化学习模型建构[J].中国电化教育,2014,(06):6-10+68.

[18]魏顺平,韩艳辉,王丽娜.基于学习过程数据挖掘与分析的在线教学反思研究[J].现代教育技术,2015,25(06):89-95.

[19]张冬青.数据挖掘在电子商务中应用问题研究[J].现代情报,2005,(09):23-25.

[20]龚著琳,陈瑛,苏懿,刘雅琴,徐立钧.数据挖掘在生物医学数据分析中的应用[J].上海交通大学学报(医学版),2010,30(11):1420-1423.

[21]何清.物联网与数据挖掘云服务[J].智能系统学报,2012,7(03):189-194.

[22]徐赟,张辉.数据挖掘在体育领域中的应用[J].武汉体育学院学报,2012,46(11):27-30.

猜你喜欢
数据挖掘教学方式课程
《无机化学》课程教学改革
数字图像处理课程混合式教学改革与探索
高校钢琴教学方式拓展的思考与实践
软件设计与开发实践课程探索与实践
为什么要学习HAA课程?
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
探索不同教学方式 提高课堂教学效果
基于GPGPU的离散数据挖掘研究