基于用户兴趣相似度的虚拟学习共同体构建

2016-01-06 20:27郝耀军郭玉凤赵青杉
中国教育信息化·高教职教 2015年9期
关键词:协同过滤网络学习学习共同体

郝耀军+郭玉凤+赵青杉

摘 要:传统在线学习共同体的构建过分依赖用户的自组织性,忽视了用户的兴趣偏好特征,放任了海量信息中用户自组织的盲目性。因此,根据学习者在网络活动中的学习行为信息,计算用户对学习内容的偏好程度,最后利用协同过滤技术,在改进用户兴趣相似度计算方法的基础上推荐组成学习共同体。通过实际应用,验证了该方法能建立有效的虚拟网络学习共同体,获得更好的学习效果。

关键词:兴趣相似度;学习共同体;网络学习;协同过滤

中图分类号:G434 文献标志码:A 文章编号:1673-8454(2015)17-0020-04z

引言

互联网的快速发展和不断普及,使在线信息成为知识的重要来源,人们的学习观念也已发生巨大改变,“从认为学习是学习者个体的知识建构的过程逐渐转向为学习是学习者参与社会群组互动并完成知识意义建构的学习观”[1]。个人学习模式已不能有效满足个人需求与社会认知的需要,基于互联网的虚拟社区应用催生了各种各样的学习社区。“虚拟学习共同体是信息技术环境下群体协作、群体智慧创造与分享的必然结果,虚拟社区为信息的快速传播、知识的分享与集体智慧的创造提供了沟通与互动的平台。”[1]

国内外的学者对此展开了广泛的研究,卢强[2]对近10多年来国内学习共同体研究进展情况进行分析和总结,指出“国内学习共同体领域主要关注学习共同体的基本理论、具体应用以及组织策略,研究热点中,学习共同体在教师专业发展领域的应用和网络学习共同体方面问题突出。” 关于学习共同体的构建研究,范玉凤[3]等对虚拟学习共同体的构成要素进行了分析,探讨了基于活动理论建构虚拟学习共同体的设计理念、方法和运行机制,并依据七个要素设计了一个虚拟学习共同体的架构原型。胡小勇[4]则研究了创建优秀网络学习共同体的实践策略,并且总结了一个基于博客平台的网络学习共同体的实践效果。在国内实践应用中,孙娟[5]等通过QQ群进行了网络学习共同体在实际教学中的应用研究;万力勇[6]探讨了基于QQ群的网络学习共同体社会互动的机制,并从互动频率、互动深度、互动方式和互动信任度等方面进行了分析;杨洪刚[7]等人则从成员角色变化的角度分析了基于SNS的学习共同体的构建过程。

在国外,这方面的一些研究包括:Judy Sheard[8]研究了建立虚拟学习社区和管理共同体的方法和策略,指出计算机作为中介的协作学习会越来越频繁,远远超过了对其理论的研究进度,在共同体的构建和管理中需要更多的技巧与策略。在实践中,宾州州立大学运用“生活—学习社区”引导学生广泛参与,在操作能力、记忆力、课堂参与度、学术能力等方面卓有成效。[9] Mary Beth Rosson等人[10]基于Facebook构建了一个称之为“wConnect”的学习社区,用以帮助女性计算机和信息科学的职业发展。

以上这些研究与实践,共同体的构建主要依赖成员的自组织,不能有效利用成员的兴趣偏好、学习进度等信息,在共同体的整个存在周期中并不与其他共同体互享信息、动态调整。然而,开放虚拟社区在以指数级增长信息量的倾泻下,不可避免地会造成信息过载现象,共同体成员很容易陷入“信息迷航”,因此,不仅要将数量巨大,来源广泛,专业兴趣爱好各异的社区成员聚集在一起构建学习共同体,更重要的是能借用信息技术合理组织、管理共同体。而源于信息检索和过滤技术的个性化推荐策略为这类问题提供了解决思路和技术支持。

协同过滤技术是最早被提出并被广泛应用的个性化推荐策略,该推荐算法主要分为两大类:一类是基于用户的协同过滤算法;另一类是基于物品的协同过滤算法。

本文根据学生的网络学习活动计算用户对学习内容的偏好程度,进而采用改进的用户兴趣相似度计算方法确定用户间的距离,利用协同过滤技术动态构建虚拟学习共同体。实现了共同体内成员以兴趣为吸引、以推荐为动力的动态流转构建机制。

一、用户兴趣偏好的度量

对用户兴趣偏好的度量需要分析用户在网络的学习行为,也即将用户网络行为的一些结构化数据转化成协同过滤算法所需要的数据结构。在建立虚拟学习社区的共同体时,必须对成员的反馈信息进行动态分析,并将其抽取、量化为共同体成员对主题或资源的兴趣偏好度,也即成员——主题学习资源的评分,类似于推荐系统中用户对物品的评分,这是采用协同过滤推荐技术的数据来源。

本文重点研究社区成员的学习主题与资源操作行为,在线学习中不像在线交易能给出明确的评分,在线学习中主要通过记录用户对学习资源的正反馈行为来考察用户的偏好,在这里主要研究和量化共同体成员对主题学习资源的关注、回帖、浏览、转载等操作行为,具体定量策略如表1所示。

表1中的权重分别设置为w1,w2,w3,w4依据其对偏好程度佐证的重要程度一般设置w1

对于浏览时长t的取值需要作特别说明:考虑到正常阅读速度和页面篇幅,t应在一个合理的范围内,因此做如下处理:

t=0 t?t1

t t1?t

t2 t?t2?t2

其中,t1表示最小阅读时间,当t低于t1时,认为学习者没有阅读该页面,可能为用户的误操作;t2表示最大阅读时间,表示用正常阅读速度能够读完的时间,超出该时间,也不能说明用户兴趣度增加,这可以避免学习者由于处理其他事情的耽搁所带来的影响。[11]

以上抽取的这些数据主要利用了用户的正反馈数据,在一定程度上衡量了社区成员参与社区互动与交流过程的表现,也捕捉了成员对虚拟社区主题学习资源的兴趣偏好程度。

二、用户间兴趣相似关系的判定

以上网络行为数据经过量化后,生成如表2所示的成员——主题学习资源得分矩阵表,该得分矩阵就是社区成员对主题学习资源兴趣度与偏好的形式化表示。

在表2中,Iij表示社区成员i对j类资源的兴趣度,该兴趣度的定量计算公式是基于社区成员i对主题j是否关注、浏览的时间、回复的次数与资源的转载情况进行的综合计算,定量的计算公式如下:

其中,attentionij表示成员i对j类主题的关注情况,如果加了关注,其值为1,否则为0;tij表示成员i对j类主题的浏览时长,avg(ti)表示成员i对社区中所有主题浏览的平均时长,二者比值反映了成员i对j类主题的特别浏览情况;ans_numij表示成员i对j类主题的回复次数,avg(ans_numi)表示成员i在社区中的平均发帖量,二者比值反映了成员i对j类主题的特别回复情况;repij表示成员i对j类主题资源的转载情况,如果进行了转载,其值为1,否则为0。

在协同过滤推荐技术实现过程中,为了生成目标用户的邻居成员集合,首先需要确定相似成员的计算方法。一般情况下,计算相似性有很多方法,常采用余弦相似性的计算方法,即通过矢量间的余弦夹角来度量用户间的相似度。公式如下:

sim(i,k)=cos(I,k)==

其中,I、K为用户i、k对所有主题的兴趣度向量,Ri,c,Rk,c分别为用户i和用户k对资源c的兴趣度。

三、改进的用户兴趣相似度计算方法

在理想状态下,随机地对学习资源的访问中,公式2能较好地反映用户间的兴趣相似度。但在实际使用中,对比网络学习共同体的学习记录发现:如果社区成员都只对基础的、热门的学习资源感兴趣,这丝毫不能说明二者兴趣的相似度高;例如,在“ACCESS数据库”虚拟学习社区中,几乎所有的学生都在开始要学习“关系数据库原理”这类学习资源,并不能说明其中的任意两个用户兴趣相似度高。反而,两个成员对冷门的学习资源采取过同样的行为更能说明他们兴趣相似度高;例如,如果两个成员都学习“菜单与工具栏”,这更能说明二者兴趣相似度高。

基于以上分析,对热门的基础资源加入惩罚因子,因而在系统中采用如下改进的计算用户兴趣相似度的公式:

其中,N(c)表示对c类资源感兴趣的用户数,Ri,c,Rk,c分别为用户i和用户k对资源c的兴趣度。

可以看到,公式3通过惩罚了成员i和成员k共同兴趣列表中热门的、基础的主题资源对他们兴趣相似度的影响,对于用户相似度的判定更加灵敏。

四、学习共同体的构建

在虚拟社区开始使用时还没有学生的学习行为数据,因此共同体在冷启动时的构建主要基于学生的注册信息和自主选择。随着学生学习行为数据的增多,对未加入学习共同体的成员按以下策略推荐其加入已有的共同体:

(1)无学习记录者,开始学习时进入知识树根结点相关的共同体学习。

(2)有学习记录者,通过系统推荐用TOPN筛选找到其用户兴趣相似度最高的5名用户。

(3)对5名用户所属的学习共同体用TOP1筛选找到认同感最大的学习共同体,推荐用户加入。

(4)若用户不认同上述结果可以自行选择加入其他学习共同体。

在协同过滤推荐过程中,随着时间的推移,社区成员的学习兴趣、专业爱好会发生变化,该计算、推荐过程也会不断重复进行,根据社区成员不间断的反馈行为,就可以计算出潜在的兴趣相似集合,进而实现动态的学习共同体构建。

在笔者主持的ACCESS数据库教改项目中,对网络学习资源按“关系数据库原理”、“SQL语言及实验”、“数据库设计”、“表操作”、“查询操作”、“窗体设计”、“宏”、“VBA编程”、“报表设计”、“菜单与工具栏”、“数据的传递与共享”等主题设计。在该学习平台,成员分属于不同的学习小组,每个学习小组可以共享学习资源,成员之间可以发私信。系统根据用户的学习记录向其推荐兴趣相似度较高的成员以及适合加入的学习共同体。该推荐更多地关注相似用户的学习状态,动态向当前用户推荐感兴趣的学习共同体,推荐其加入。社区某用户登录并学习一段时间后,有如图1所示的学习界面。

在未改进兴趣相似度算法之前,由于知识树的根结点“关系数据库原理”主题学习资源处于基础地位,学习用户较多,在开始推荐时由于受其影响会向每个用户推荐加入“关系数据库原理”学习共同体,并且在后续学习中“关系数据库原理”学习共同体总会出现在推荐中,推荐效果并不理想,该资源的“群集”现象十分明显,后来利用改进的公式3,加入惩罚因子后,推荐的精度和灵敏度都大幅度提高。

在上述学习共同体的构建中,以相对静态的学习主题资源划分若干数目相对确定的学习共同体,共同体内的成员以兴趣为基础组织,随着学习的进展,成员在不同的共同体间流动,从而吸引兴趣相近的好友在不同的共同体间迁徙。这种以兴趣吸引为基础、以集中迁徙为动力的机制可以促使所有学习者在不同主题资源的学习共同体内交叉进步。

五、关键技术实现

系统基于.NET平台开发,开发环境使用Visual Studio 2008,采用基于B/S的三层体系结构,用ASP.Net实现,在协同过滤技术的实现环节引入IronPython语言编程实现。在混合编程时,需要在ASP.Net的WebSite项目中添加对IronPython.dll,ironMath.dll,Microsoft.Web.IronPython.dll三个文件的引用。

对于改进的用户兴趣相似度计算方法的关键IronPython代码如下:

def userSim(train):

#建立倒排表

Item_users=dict()

for u,items in train.items():

for j in items.keys():

if j not in item_users:

Item_users[j]=set()

Item_users[j].add(u)

#计算用户间的兴趣相似度

C=dict()

N=dict()

for j, users in item_users.items():

for u in users:

N[u] +=1

for v in users:

if u==v:

Continue

C[u][v]+=1/math.log(1+len(users))

#计算改进的兴趣相似度

W=dict()

for u,related_users in C.items():

for v, cuv in related_users.item():

W[u][v]=cuv/math.sqrt(N[u]*N[v])

return W

六、结束语

本文设计了一种基于改进用户兴趣相似度的学习共同体的构建方法,借鉴协同过滤算法思想将具有相似兴趣的学习者自动有效地组织成学习共同体,帮助虚拟社区“人以群分”,促进协作式学习。在学习共同体的生成中既摒弃了盲目的自组织性,又兼顾了用户的自主性,保证信息畅通。实验结果证明:该构建方法具有较高的分组效率和良好的用户满意度,灵活动态的组建方法和适当的流转迁徙机制都有积极的探索意义。但用户在初次“冷启动”学习时一般按学习进度默认加入“初始学习组”,这种处理方式还需要探讨改进。

参考文献:

[1]杨丽娜,颜志军等.基于个性化推荐思想的虚拟社区学习共同体动态构建[J].现代教育技术,2012,22(1):88-92.

[2]卢强.国内学习共同体研究现状与进展分析[J].中国远程教育,2012(5):29-35.

[3]范玉凤,李欣.活动理论视角下的虚拟学习共同体构建研究[J].中国电化教育,2013(2):43-47.

[4]胡小勇.促进教师专业发展的网络学习共同体创建研究[J].开放教育研究,2009(2):87-91.

[5]孙娟,熊才平,谢耀辉.基于IM的网络学习共同体构建及应用研究[J].现代教育技术2011,21(4):130-135.

[6]万力勇,赵呈领等.基于群的网络学习共同体社会互动研究[J].电化教育研究,2012(9):56-58.

[7]杨洪刚,宁玉文,高东怀等.基于SNS的网络学习共同体构建研究[J].现代教育技术,2010,20(5):93-96.

[8]Judy Sheard.Electronic Learning Communities: Strategies for Establishment and Management[J].ITiCSE04,United Kingdom, 2004(8):37-41.

[9]Sandra Gorka, Matthew Helf, Jacob Miller. Implementing a Living-Learning Community in Information Technology[J].SIGITE14, Atlanta, Georgia, USA, 2014(10):153-157.

[10]Mary Beth Rosson, John M. Carroll, Dejin Zhao, Timothy Paone. wConnect: A Facebook-Based Developmental Learning Community to Support Women in Information Technology[J]. C&T09, University Park, Pennsylvania, USA, 2009(6):125-134.

[11]何玲,高琳琦.网络环境中学习资料的个性化推荐方法[J].中国远程教育, 2009(2):67-69.

[12]项亮.推荐系统实践[M].北京:人民邮电出版社,2012.

[13]席亚卿,马芳.基于群体动力机制的校际网络学习共同体支撑平台的构建[J].中国教育信息化,2012(5):37-38.

(编辑:杨馥红)

猜你喜欢
协同过滤网络学习学习共同体
基于“微信群”的大学生英语学习共同体建设
网络学习行为背景下的慕课教学策略研究
大学英语创造性学习共同体模式建构案例研究
培养初中学生英语自主学习能力的尝试