WEB挖掘在课程开发与教学资源管理平台中的应用研究

2015-02-21 06:48任锁平
电子设计工程 2015年18期
关键词:日志数据挖掘资源管理

任锁平

(陕西职业技术学院 教务处,陕西 西安710100)

WEB挖掘在课程开发与教学资源管理平台中的应用研究

任锁平

(陕西职业技术学院 教务处,陕西 西安710100)

随着计算机网络技术的不断发展和进步,数据挖掘在各行业得到了大力的应用。基于课程开发与教学资源管理平台在后期的数据处理方面存在的不足,将WEB挖掘技术应用于课程开发与教学资源管理平台,提出了系统设计的需求及WEB使用挖掘在平台中的应用,通过案例分析,提高了平台的使用效率。

WEB挖掘;课程开发与教学资源管理平台;设计;WEB使用挖掘

随着互联网信息技术迅猛发展,网络已经深入到我们的学习生活中,并产生了深刻影响。据中国互联网络信息中心发布的第35次《中国互联网络发展统计报告(2015年1月)》显示截至 2014年 12月,中国网民规模达6.49亿,互联网普及率为 47.9﹪[1]。由此可见互联网的发展规模之大。而作为高等职业院校,课程开发与教学资源管理平台的建设成为互联网快速发展时代学校资源共享与交流的知识共享系统,不仅仅是资源的共享,同时也是网络时代生成性知识产生的重要平台,有利于改变传统的教学方式,提高教育教学质量。

1 WEB挖掘

1.1 WEB挖掘概述

Web挖掘是在数据挖掘的概念上产生的,是数据挖掘技术在Web上的应用,利用数据挖掘技术从与WWW相关的资源和行为中抽取感兴趣的、有用的模式和隐含的、有潜在应用价值的信息,涉及Web技术、数据挖掘、计算机语言学、人工智能、统计学、信息学等多个领域,是一项综合技术[2]。WEB挖掘技术通常可以划分为建立在统计模型基础上,主要包括有决策树、分类、聚类、关联规则等;另外一种则是人工智能模型,主要包括神经网络、自然法则计算方法等。

1.2 WEB挖掘的分类

一般情况下,WEB挖掘技术可分为3类,即WEB内容挖掘、WEB结构挖掘、WEB使用挖掘3类[3]。其中内容挖掘又可分为文本和多媒体挖掘两类,前者可以对文档的内容、关联性、趋势进行挖掘分析,后者是指对图形图像音视频等文件进行挖掘提取;结构包括有网站目录结构、超链接等结构类型,可以使用HITS算法、PageRank算法进行WEB结构挖掘;使用挖掘主要是通过WEB日志记录进行数据挖掘分析,主要挖掘浏览者在访问站点的过程或行为中所产生的数据。具体如图1所示。

图1 WEB挖掘的分类Fig.1 The classification of WEB mining

2 课程开发与教学资源管理平台架构设计

2.1 总体设计

在教育信息化发展的引领下,计算机网络资源已经成为教育教学过程中必不可少的学习资源,整合优质的学习资源显得尤为重要。该平台能够满足教师教学需求,为高职教育提供优质教学资源与服务,集资源设计、建设、开发、共享等功能为一体的,能够为教师提供各种教学资源来促进教学手段和方法的改革,提升教学质量;为学习者提供丰富的学习资源,提高学习效率。

该平台功能设计由3部分构成,分别为精品课程模块、网络课程模块、资源平台模块等,每一部分均有自己独立的功能,同时三部分之间也相互联系,网络课程和精品课程中的资源均可以共享在资源平台中。平台有门户页面、教师登录页面、管理员页面,每个页面之间相互独立,所有的课程及资源均可在门户页面登录学习和使用。教师登录页面具备了整个平台的功能操作,可进行课程和资源的更新制作,进行课程和资源的设计与维护。管理员通过管理页面可以对系统进行整体的维护和设置。

2.2 平台开发模式

平台采用分布式架构设计,采用B/S(浏览器/服务器模式)架构,基于Web技术开发,管理员和用户不必另外安装客户端软件,仅使用浏览器就可以进行使用和管理平台相关操作。平台可分布式部署:将服务器进行分离部署,将Web Server和Database Server分布部署;同时平台可根据用户量的增大而扩充服务器数量,具有出色的系统稳定性的可扩展性,支持服务器集群。

平台采用Windows Server2008系统,Sql Server 2008 R2数据库,使用Java进行开发。基于安全策略的用户组和权限管理确保了平台与服务器的安全,采用模块化设计,并采用基于Load_balance的Web计算。

2.3 数据库设计

课程开发与教学资源管理平台设计中,系统的主要对象是教师、学生、课程和资源等。分别对应着不同的属性,例如教师的属性包括有姓名、性别、职称、所属院系等。学生的属性包括有姓名、学号、年级、班级、专业等。课程的属性包括课程编号、所属专业、授课教师等,在设计中应根据具体的对应关系确定合理的数据库表,应将所有的属性设计在数据库表中。下面以教师表和课程表的设计来描述数据库的具体实现。

表1 教师表Tab.1 Teacher table

2.4 数据仓库设计

采用SQL Server2008建立数据仓库,根据决策分析的需求与预测目标,探寻资源和课程实际需求,为学习者提供更多的感兴趣的学习资源和课程,为教育管理者和决策者提供决策依据。根据平台使用情况整理数据信息,经过数据清洗和整理后,本次数据仓库设计主要是分析统计数据仓库,建立以资源、课程和学习者等3个主题。其中资源主题主要描述资源的类型、大小、学科类型等信息,课程主题主要描述课程类型、课程所属学科、课程点击量等信息,学习者主题主要描述不同学习者的基本信息、学习时长、学习时段、使用资源类型等基本信息。3个主题含有共同的字段作为主码的一部分,方便将各个主题之间进行联系。随着信息量的逐步增多,相应主题下的表及其关联性也不断扩充,数据仓库中信息也随之越来越丰富,最终涉及整个平台[4]。

表2 课程表Tab.2 The curriculum

3 实际应用

3.1 课程与资源开发

本系统实现了教师一站式开发和发布课程开发模式,教师只需通过登录后台,即可建立精品课程或网络课程,同时上传学习资源。教师根据各个专业或各个课程分类的不同特点,选择具有特定属性的课程模板,也可自定义课程模板中的属性实现制作定制的课程;同时实现课程和资源标签属性设置,便于平台内部进行搜索和归类。课程生成符合SCORM标准,同时支持将课程导出。资源提供多种格式进行上传,学习者进行资源下载同时也可进行资源评价,为其他学习者提供参考。课程开发与教学资源管理平台中课程与资源发布界面如图2所示。

3.2 WEB使用记录挖掘

WEB挖掘一般而言需要对数据源的规范和要求进行一定的预处理,达到能够挖掘分析的目的,高质量的数据预处理保证了数据挖掘的效果[5]。 WEB日志是客户端使用浏览器访问服务器时留下来的记录信息和痕迹,它提供了WEB挖掘的重要数据源,日志挖掘的主要数据对象就是WEB日志数据记录。

学习者或教师登陆平台进行访问时,平台自动记录了访问者的点击行为,并按每日记录保存在WEB日志文件中,由于该平台采用Windows Server服务器,因此其使用IIS进行网络环境搭建, 其日志保存目录为﹪SystemDrive﹪inetpublogsLogFiles,可自由设置,通过IIS进行网站日志文件保存选项进行保存目录及保存时将和方式等进行设置,该平台采用按日记录,方便后期进行WEB挖掘分析。

图2 课程与资源发布界面Fig.2 The curriculum and resources released interface

3.2.1 课程开发与教学资源管理平台日志文件挖掘

WEB日志是以txt格式保存的,WEB挖掘的方法有很多,主要使用挖掘工具进行挖掘分析,常用的工具主要有AWStats、Webalizer、Analog、web log explorer、web log expert等。

文章使用Web Log Explorer进行分析,Web Log Explorer具有的功能[6]包括有:1)能够统计从FTP下载到本地的日志文件,支持多种格式;2)文件类型组别的统计及分类;3)允许用户自定义分类,如:CSS、JS、images、pages、downloads等;4)常规的日志属性统计;5)能够统计路径分类,文件夹分类,所有文件类型,所有错误响应码;6)访问者报告:能够统计出主机分类、访问分类和国家分类等;7)引用报告:能够统计出来路分类、关键词分类、搜索引擎分类等;8)用户代理报告:能统计所有类型,包括蜘蛛分类,浏览器分类,操作系统分类等,并且有很多查看方式,如日期,页面等;9)日期属性:适合查看网站总体的一个情况,也可以按年、月、日、星期、小时查看。

3.2.2 结果分析

文章采用Web Log Explorer分析了平台WEB日志中的2015年2月22日——2015年2月28日期间的日志记录进行了简单分析。主要分析了网页的点击量,结果如图3所示。

图3 平台点击量分析Fig.3 Platform for traffic analysis

通过上图可以看出在2015年2月22日——2015年2月28日期间平台的点击量差异比较大,每种颜色代表一天,从左至右代表22日—28日,其中27日点击量约为920次,为此时段内最多点击量,23日、24日、25日点击量较低。

4 结束语

随着互联网技术的迅猛发展,结合WEB挖掘对课程开发与教学资源管理平台进行数据挖掘分析,不仅可以帮助教师对课程和资源的使用情况掌握和了解,同时也有利于在后期对资源进行更新和设计时作出更加符合学习者要求的资源和课程设计,促进学习效果的提升,提升教育教学质量。

[1]中国互联网络信息中心.中国互联网络发展统计报告[EB/OL].[2015-02-23]http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/201502/P020150203551802054676.pdf.

[2]WEB挖掘.百度百科[EB/OL].[2015-02-26]http://baike.baidu.com/view/1133748.htm.

[3]胡秀.基于WEB的数据挖掘技术研究[J].软件导刊,2015(1): 149-150.HU Xiu.data mining techniques based on WEB[J].Software Guide,2015(1):149-150.

[4]张青.教学管理数据仓库的设计与应用[J].数字技术与应用,2012(1):111-112.ZHANG Qing.Design and Application of Teaching Management Data Warehouse[J].Digital Technology and Application,2012(1):111-112.

[5]卢明泰.WEB挖掘及其在社交网络中的应用研究[D].西安:电子科技大学,2012.

[6]EL-数字化教育.Web Log Explorer3.85.056中文版[EB/OL].[2015-02-29]http://blog.sina.com.cn/s/blog_706ef0120102vpwd.html.

Research-based teaching resources in a shared platform WEB mining

REN Suo-ping
(Office of Academic Affairs,Shaanxi Vocational and Technical College,Xi’an 710100,China)

With the continuous development of computer network technology and progress,data mining has been greatly used in various fields.Based on the curriculum development and teaching resource management platform in the aspect of data processing in the late of WEB mining technology was applied to curriculum development and teaching resources management platform,puts forward the demand of the system design and WEB usage mining on the platform,the application of through case analysis,improve the efficiency of the use of the platform.

WEB mining;Curriculum development and teaching resource management platform;design;WEB use mining

TN99

:A

:1674-6236(2015)18-0056-03

2014-02-18稿件编号:201402080

任锁平(1986—),男,陕西商洛人,硕士,助教。研究方向:教育信息技术、教育信息化。

猜你喜欢
日志数据挖掘资源管理
人事档案管理在人力资源管理中的作用
人力资源管理促进企业绩效提升
一名老党员的工作日志
企业人力资源管理
探讨人工智能与数据挖掘发展趋势
扶贫日志
GIS在森林资源管理中的应用
游学日志
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用