MOOC推荐系统的设计与实现

2018-03-22 01:31乔丽娟
电子技术与软件工程 2018年1期
关键词:推荐系统数据分析

乔丽娟

本文认为尽管MOOC仍有不尽如人意的地方,但确实为许多求学无门的学子带来了曙光。所以,基于这样的观点,本文旨在分析提高学习者学习效果的方法。推荐系统是大数据背景下的应用热点之一,本文通过分析CanvasNetwork在2016年发布的开放数据集,设计了一个推荐系统,根据学习者输入的数据,简单实现了成绩预测的功能。

【关键词】MOOC 数据分析 推荐系统

自从2011年以来,MOOC经历了巨大的增长,引用《经济学人》的一句话就是:学术界象牙塔的基石受到了撼动。体现MOOC巨大增长的一个重要方面就是注册MOOC课程的学习者数量大大增加,达到了几十万甚至百万、千万的量级。与此同时,支撑MOOC服务的后台数据也以百万、千万的量级增加。这些数据真实的记录了学习者的信息,比如学习者的年龄、学历、参与课程原因、每周期望小时数等。除此之外,还有学习者的学习行为信息,如交互次数、访问次数、论坛发帖数。显而易见,MOOC数据中蕴藏巨大的信息价值,通过MOOC数据的分析,设计MOOC推荐系统,可以对MOOC的发展做出一定贡献。

1 MOOC推荐系统需求分析

根据对MOOC发展现状的探讨,本文了解到,一方面,高校对MOOC大多报以积极的态度。有实力的高校已经初步建设里自己的MOOC平台,他们希望通过这种大规模、开放、在线的新形式来提升教学质量,使老师的教学、学生的学习更灵活、更有弹性。对此,高校积极组织权威教师录制MOOC课程,但是,什么样的课程是学生感兴趣的?在分类繁杂的科目类别中,哪些课程是学生最为渴求的?另一方面,学生也活跃于各大MOOC平台。然而,他们中大量的人仅注册了账号,却未参加课程;参加了课程的,能坚持下来的则又是少之又少。是什么原因导致MOOC的高辍学率呢?面对这些问题,对MOOC平台数据的挖掘是具有参考价值的。

从整体需求来看,可以分为两个层次。第一是课程资源的内容收集,整合了各平台的课程基础信息,为用户提供了统一的入口。第二是课程推荐部分,有效地利用了平台内部整合的信息,帮助用户发现新的课程。课程资源整合收集的目的是将分散在各自平台的课程资源聚合到一个统一结构的数据库中。课程推荐是为了帮助用户发现新的课程,同时也是帮助课程发现新的用户。从需求上来看,大部分用户都有发现新课程的需求。课程推荐功能就是利用了平台内积累的用户数据,进行合理的统计分析和数据分析,猜测用户可能喜欢的课程。

2 MOOC推荐系统的设计及实现

本文的推荐系统设计的目的是应用数据分析过程得出的结论。系统要实现的基本功能是用户的注册、登录和系统的推荐。系统界面采用Java语言实现,数据库使用的是MySQL。系统实现了用户的登录、注册,支持用户添加推荐标签,完成了课程的推荐和成绩的预测。

2.1 课程推荐设计

推荐课程设计的大致思路:首先,根据学习者添加的标签,依据参与课程原因、年龄、学历和每周期望小时数,根据数据分析中得出的结论可以得到适合该名学习者的学习类别。比如,学习者参与MOOC学习的目的是为了学习技能以发展新的职业,那么根据前期的数据分析我们可以知道,他的首选类别会是“职业与应用科学”。由于仅凭一个变量得到的类型既不准确,也不全面,所以,作者选择四个变量进行分析。得到的类别是四个变量指向的科目类别的集合。其次,选择数据库中,类别集合里评分与关注人数的加权平均值较高的一些课程加入到推荐课程的集合。最后,将推荐课程返回界面,以列表的形式展现给用户。

2.2 预测成绩

类似的,成绩的预测也是从学习者最初设置的标签出发。程序通过计算用户输入的交互次数、访问天数、课程章节数、“论坛发帖数”和课程长度与“聚类结果集”之间的欧式距离,选择欧式距离最小的结果对应的成绩分段,则可以得到用户未来成绩可能的范围,再在该范围中取随机数,然后返回界面显示给用户。

3 MOOC推荐系统结果分析

3.1 输入测试用例

为直接观察推荐的结果,输入一组数据如表1。

3.2 输出结果分析

返回结果如图1所示。

4 总结

推荐系统的设计是当今热点之一。本文设计的推荐系统还有很多不足之处,将不断吸取别人的经验,跟上技术创新的步伐,不断学习、前进。

参考文献

[1]The Economist(2013)Theat tack of the MOOCs,TheEconomist,2013.

[2]李弘運.基于微博的在线学习资源推荐平台核心功能设计与实现[D].北京邮电大学,2015.

作者单位

曲阜师范大学软件学院 山东省曲阜市 273100

猜你喜欢
推荐系统数据分析
基于用户偏好的信任网络随机游走推荐模型
浅析大数据时代对企业营销模式的影响