基于富媒体的在线学习平台的设计与研究

2019-07-16 03:14刘超慧陶浩武邢丹阳李宇根
电脑知识与技术 2019年15期
关键词:分词语句教学资源

刘超慧 陶浩武 邢丹阳 李宇根

摘要:随着互联网技术的发展和富媒体教学理念的兴起,在线学习评论数量增加,高效地将评论信息反馈给教师成为教学的新需求。论文概述了富媒体的相关概念和研究现状,构建了基于最大正向匹配算法的语句关键词提取模型,論述了富媒体教学资源开发流程。最后,利用AJAX和Servlet等编程技术,设计完成了富媒体教学资源平台,平台运行结果表明在海量评论语句环境下能减轻授课教师负担,提高教学效果,具有一定的推广应用价值。

关键词:富媒体;最大正向匹配算法;语句关键词提取;学习平台

中图分类号:G434        文献标识码:A

文章编号:1009-3044(2019)15-0176-03

Abstract: With the development of Internet technology and the rise of Rich Media teaching concept, the number of online learning reviews has increased. Feedback of comments to teachers efficiently becomes a new requirement of education. This paper summarizes the related concepts and research status of Rich Media, constructs a sentence keyword extraction model based on Maximum Matching Algorithm, and discusses the development process of Rich Media Teaching Resources. Finally, using AJAX and Servlet programming technology, designed and completed the platform of rich media teaching resources. The results show that the platform can reduce the burden of teaching teachers and improve the teaching effect under the environment of massive comment sentences, which has certain application value.

Key words:Rich Media; Maximum Matching; Sentence keyword extraction; Learning platform

1 引言

富媒体教学理念的兴起,为教育教学提供了新的思路和方法。教育部于2015年发布《关于“十三五”期间全面深入推进教育信息化工作的指导意见》提出“要通过融合创新提升教育信息化效能”,“互联网+教育”已成为新的教育探索领域[1]。富媒体充分将视频、文字、图片和声音等融为一体,能极大地丰富教学手段,提高教学效果。随着在线教学平台的逐步推广,学习评论数量也日益增多。然而教师通过分析学习评论,来了解学生学习情况,变得困难起来。正向最大匹配算法为解决类似问题,提供了新思路。

文章在富媒体教学资源开发过程中,通过增加关键词提取,构建了语句反馈模型。在此基础上,开发了富媒体教学资源平台,平台为减轻授课教师的压力,提高教学效率和质量提供了新思路。

2 相关理论介绍

2.1 富媒体教学资源

富媒体(Rich Media)是指具有动画、声音、视频和交互性的信息的传播方法,是包括以下常见形式之一或者是几种的组合:流媒体、声音、Flash、以及JavaScript、DHTML等程序设计语言。用于赋予传统媒体以友好的交互效果和复杂的视觉体验,是结合了传统媒体技术和交互技术的新兴媒体形式,具有丰富多样的UI展现、深度的用户交互、实时响应和动态驱动性[4]。

国外发达国家教育信息化进程快,对富媒体运用于教学有更多的研究。2012年,Inkling公司推出的Habitat数字化教材出版平台,可以更快捷地生产交互式电子书[2]。2015年,英国推出数字教材平台Kortext,且整合进微软的办公软件,使得世界的大学生都能通过365平台进行使用[3]。余涛等人指出富媒体教材在推动教育教学改革方面起重要作用[5]。将富媒体用于在线教学无疑能够最大限度的丰富课程资源,提高互动性。

2.2 正向最大匹配算法

正向最大匹配算法,是一种基于字符串匹配的分词方法,在机械分词中占据主流地位。其基本思想为:

S1:统计得到语料库中最长词条,并将其记为最大词长maxLen;

S2:在待切分语句中从第1个字开始取以len为长度的字符串str;

S3:在语料库中查找比对是否存在以str字符串构成的词。若存在,表明得到一个提取词,转到S5;若不存在继续执行S4;

S4:去除str最右边的一个字符,判断len是否为1。若len=1表明这是一个单字;若不等于,转到S3;

S5:把str字符串从待切分语句中删除,判断此时语句是否为空。若不为空转到S2;若为空表明此语句已匹配完毕。

该算法易于理解,实现简单,因此得到了广泛的应用。但仍存在着初始最大词长设置不合理、覆盖范围不合理、歧义识别等问题。为此,很多学者进行了富有成效的研究[6-8]。郭丙华等人提出一种基于词语搭配关系的分词歧义性消除方法[7]。王瑞雷等人提出了一种基于改进Trie树结构的正向最大匹配算法,能有效提高中文分词速度[8]。

3 富媒体教学平台的设计

3.1 系统需求分析

围绕减轻教师授课压力为主要目标开发富媒体教学资源系统。系统分为游客、学生、教师三类用户。经注册登录后,教师可创建课程、查看学生学习进度、通过反馈模获取学生的学习反馈信息;游客可以浏览相关信息,但不可以在線学习和发布评论;学生可加入课程、在线学习;系统提供讨论区,学生可发布话题、回答他人评论、点赞高质量解答等。

3.2 系统功能分析

平台功能采用面向对象设计的思想。学生有包括个人信息、课程管理等在内的四个模块。教师有包括教学资源管理、学生管理、个人中心等三个模块。学生进行课程学习,在互助讨论区,发表对于未理解知识的疑惑或解决他人问题,系统对学生疑惑的评论提取关键字,反馈给教师,教师以此为依据修改课程重点难点内容。每个模块包含若干个功能,整体功能模块图如图1所示。

4 反馈模型的构建及系统实现

4.1 关键词提取模型的构建

将评论语句分为求助帖(未理解的知识点)和回答帖(已理解的知识点)两大类,通过TF-IDF(Term Frequency-Inverse Document Frequency)算法来获取文档类型富媒体教学资源的特征,用作正向最大匹配算法的语料库。同时对语句进行预处理,去除句子中对句子整体语义无贡献的停用与常用词等词汇,在用正向最大匹配算法得到关键词。主要操作步骤如下:

Step1:使用TF-IDF算法从富媒体教学资源中得到文本特征集合,并作为语料库data。其中,富媒体教学资源中的具体文本记为dj,词记为ti,用n(i,j)表示特定词ti在文本dj中出现的次数,用Σknk,j表示在文本dj中出现所有词次数之和,|D|表示在教学资源中所出现的文本总数,具体的表达式如式1。

Step2:统计词库的词汇得到最长词条,并将其记为最大词长maxLen;

Step3:对待切分语句进行预处理,从左至右以此扫描去除对语义无影响的字词,得到新的待切分语句sentence;

Step4: 对语句sentence执行正向最大匹配算法,得到关键词集合;

至此,模型已构建成功,可以更加精准且高效地得到具体领域内的专业词汇。

4.2 教学资源开发流程

此模块主要是面向教师发布资源使用。教师创建或修正的课程素材,系统进行加工、分类和整合,最终形成富媒体在线教学资源,支持在线学习和讨论。系统对学生未理解的评论,通过上述语句关键词提取反馈模型得到未理解的专业性知识点,并反馈教师,便于教师对教学资源进行修正,流程图如图2所示。

4.3 平台的功能实现

平台前端开发利用HTML5+CSS3+JavaScript等技术,其中JavaScript是使用的jQuery类库,后台通过Servlet+MySQL+tomcat实现开发,通过AJAX实现前后台的交互,且数据以JSON格式进行传送,从而实现对页面的局部刷新。平台利用开源的集成开发环境eclipse和MySQL数据库系统,易于搭建。平台的在线学习界面如图3所示,学生话题讨论区如图4所示。

以学生在线浏览文档类型的富媒体教学资源为例介绍实现具体细节。前端使用了JQuery类库和Font Awesome的图标字体库,需要在HTML文件中引入如下所示的代码:

在后台通过Java的POI来实现对文档的操纵,读取文档内容主要代码如下,其中path是给定的文件路径,str是得到的文档内容:

OPCPackage opcPackage = POIXMLDocument.openPackage(path);

POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);

str=extractor.getText();

在Servlet中对得到的文档内容进行封装,以JSON格式传至前端AJAX中,使用JSON作为数据传送格式需在项目中引入JSON所需的jar包。主要代码如下,其中response是传回客户端的响应数据。

JSONObject obj=new JSONObject();

obj.put("content", str);

response.getWriter().append(obj.toString());

最后AJAX对得到的数据进行解析并加载呈现在前端界面。主要代码如下,其中在请求成功后的回调函数success中的get(result)是对得到的数据进行解析的函数。

$.ajax({

contentType: "application/x-www-form-urlencoded; charset=utf-8",

type:"post",

url:"/ourweb/onloadFileServlet",

async:true,

data:"",

dataType:"JSON",

success:function(result){ get(result); },

error:function(request){ alert("error!"); }

});

5 总结

随着互联网技术的深入发展和富媒体教学的兴起,在线学习评论语句数量激增,给教师了解学生学习的基本情况带来新的挑战。论文在诸多学者研究的基础上,对未理解评论语句构建了关键词提取模型,开发了富媒体在线教学平台,能有效减轻教师的授课负担。然而中文文本信息处理技术是个复杂的问题,需进一步通过对评论信息进行提取,进而对学生进行画像学生,提供个性化服务。

参考文献:

[1]范燕莹.“书联网”:整合的不仅是教育内容[N].中国新闻出版广电报,2016-01-25(05).

[2]李逢庆.信息时代大学教学支持服务体系发展研究[D].南京大学,2013.

[3]吴丹.富媒体数字教材的特性及应用研究[D].北京印刷学院,2015.

[4]傅伟.富媒体技术在数字化学习终端上的应用探索[J].远程教育杂志,2011,29(4):95-102.

[5]余涛.刘超慧.富媒体教材出版的应用研究[J].科技与出版,2017(11):165-168.

[6]陈开昌.自然语言处理技术中的中文分词研究[J].信息与电脑,2016(19).

[7]郭丙华.俞亚堃.李中华.基于词语搭配关系的一种中文分词歧义性消除方法[J].计算机应用与软件,2016(10):94-97.

[8]王瑞雷,栾静,潘晓花,等.一种改进的中文分词正向最大匹配算法[J]. 计算机应用与软件, 2011, 28(3):276-278.

[9]胡炎贵.面向“书联网”的富媒体教学资源管理平台的设计与开发[D].华中师范大学,2018.

【通联编辑:王力】

猜你喜欢
分词语句教学资源
分词在英语教学中的妙用
重点:语句衔接
初中语文数字化教学资源应用探索
初探教学资源开发的系统思维
临床实验教学中教学资源的整合优化与应用
如何搞定语句衔接题
土木工程科研资源转化为实践教学资源的探索
论英语不定式和-ing分词的语义传承
作文语句实录