在线学习社区意见领袖识别算法研究

2017-04-26 23:32罗凌
计算机时代 2017年4期
关键词:在线学习影响力

罗凌

摘 要: 协作学习能较好的提高在线学习的学习效果,意见领袖作为协作学习重要的组织者和实施者,对进一步提升学习效果起着重要作用。本文在分析了学习者在线学习行为,在此基础上构建了在线学习者影响力模型,并基于PageRank设计了学习者影响力识别算法,通过该算法可以更准确地识别出影响力较高的学习者作为意见领袖。

关键词: 在线学习; 影响力; 学习领袖; PageRank

中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2017)04-60-03

Abstract: Collaborative learning can improve the learning effect of online learning. Opinion leaders as an important organizer and implementer of collaborative learning, play an important role to further enhance the learning effect. Based on the analysis of online learners' behaviors, this paper constructs an online learners' influence model, and designs learners' influence identification algorithm based on PageRank. By the algorithm, some learners who have higher influence will be recognized as the opinion leaders of online learning group.

Key words: online learning; influence; opinion leaders; PageRank

0 引言

近几年,在线学习的热潮一浪高过一浪,特别是随着Moocs学习的兴起,全球有数亿人次参与到在线学习中。但是在线学习的效果并不是非常理想,学生辍学率非常高。

协作学习是加强学习者之间的互动联系,减少网络学习孤独感,提升学习体验和学习效果的较佳方式。协作学习一般以小组为单位,优秀的小组领导者,也称为意见领袖,能将小组有力地组织起来进行交互学习,提升学习效果[1-2]。国内对于意见领袖的识别研究尚集中在论坛、微博、期刊作者等领域,而对如何有效地识别在线学习社区中的意见领袖的研究较少。

本文分析了在线学习者学习行为,在此基础上,构建了学习者影响力模型,设计基于PageRank的学习者影响力识别算法。根据算法就能更加准确的确定影响力较高的学习者,并将其作为协作学习小组中的学习领袖。

1 學习者影响力模型

意见领袖作为学习小组的核心人物,在组织和实施小组协作学习方面起到至关重要的作用[3]。影响力是识别学习领袖的重要依据。在虚拟学习社区中,如果学习者在论坛和讨论中发帖、回帖次数较多,可认为其兴趣度、振奋度较高,表明其学习状态是活跃的,影响力也较大。在学习小组聚类后,就可以从小组中挑选影响力较高的学生作为学习领袖[3]。通过对学习者在线学习行为的分析,本文将在线学习者影响力分为正面影响力和侧面影响力,并构建了学习者影响力模型,如图1所示。

⑴ 正面影响力:即学习者主动参与各项网络活动所形成的影响力。

① 论坛:主要指学习者发帖数、回帖数和读贴数。

② 在线聊天:指学习者访问聊天室的次数和在线发言的次数。其中主要因素为在线发言次数,因为有的学习者可能访问聊天室的目的仅仅是关注其他学习者的讨论。

③ 电子邮件:主要指发出新邮件数和回复邮件数目。

⑵ 侧面影响力:主要指其他学习者主动与该学习者互动的过程中,对该学习者的认可度,可以从侧面反映出学习者的影响力。

① 论坛:主要指被回帖数,即其他学习者回复该学习者的回帖数,被回帖数越多,说明该学习者的受重视程度越高,侧面影响力越大。此外,被浏览次数也具有参考价值。因为有些学习者可能浏览了帖子但没有回复,不过这些学习者浏览了帖子,就说明该帖子有一定的价值。

② 在线聊天:是指该学习者被回答问题的次数。

③ 电子邮件:是指该学习者收到其他学习者的回复邮件数。

2 PageRank算法

PageRank是Google搜索引擎用于网页重要性排名的重要算法,该算法主要通过计算得到在不同时候各个网页的链接价值来判断网页的重要性。PageRank的核心思想体现在下面两个方面:①如果网络中有多个网页都链接到某个网页,说明这个网页重要性高,其相应的链接价值也相对较高;②如果链接到某个网页的链接中有链接价值比较高的网页,那么即使链接到该网页的网页数量少,该网页也拥有较高的链接价值[4]。以图2为例,说明网页的PageRank价值如何体现。

图2中每个网页都以一个圆形表示,网页的价值体现在圆形的大小上,圆形越大,说明该网页拥有更高的链接价值。从图中可以看出指向网页A的链接数最多,因此A的链接价值最高。此外,对于D而言,显然链接到D的网页很少,但是链接价值最高的网页A也指向D,因此D同样拥有较高的链接价值。

PageRank算法的核心公式如式⑴所示:

其中PR(u)是网页u 的PageRank值,PR(v)是网页v的PageRank值,Ru是链接到网页u的网页集合,N(v)为网页v向外的所有链接数,d表示页面u被随机访问的概率。

3 在线学习社区学习者影响力识别算法

在线学习社区中,学习者之间的交互关系也可以抽象为网页间的关系。一个学习者如果和网络中的其他用户发生的交互行为越多,说明该用户越积极,其影响力越高;同样,即使该学习者和其他学习者的交互行为较少,但是和该学习者进行交互的大都是影响力较高的用户,相应也提升了该学习者的影响力。这与PageRank算法对网页价值的判断相似。因此,本文设计了基于PageRank的学习者影响力识别算法。算法具体设计如下。

步骤1 根据影响力模型计算学习者初始影响力。

学习者影响力包括正面影响力和侧面影响力,因此需要分别从这两个方面综合计算学习者的初始影响力。

⑴ 正面影响力表征

正面影响力用R1表示,R1={FM,CM,EM},其中FM表示论坛,CM表示在线聊天,EM表示电子邮件。FM={FM1,FM2,FM3},各分量分别表示学习者在论坛中发帖,回帖和读贴数;CM={CM1,CM2},各分量分别表示学习者在聊天室发言次数和访问聊天室次数;EM={EM1,EM2},各分量分别表示学习者发新邮件数和回复邮件数。根据专家经验,FM、CM和EM各分量的权重分别为:WFM={0.5,0.3,0.2},WCM={0.7,0.3},WEM={0.6,0.4}。

⑵ 侧面影响力表征

侧面影响力用R2表示,R2={FS,CS,ES},FS表示论坛,CS表示在线聊天,ES表示电子邮件。FS={FS1,FS2},各分量分别表示被回帖数和被读贴数;CS={CS1},表示被回答问题次数;ES={ES1},表示学习者收到的其他学习者的回复邮件数。根据专家经验,FS、CS和ES各分量的权重分别为:WFS={0.7,0.3},WCS={1},WES={1}。

⑶ 初始影响力计算公式

学习者的初始影响力由正面影响力和侧面影响力构成,公式为:

步骤2 基于PageRank算法计算学习者实际影响力

在线学习网络中,可以将学习者视为网络中的节点,学习者之间的交互行为视为节点之间的边。例如,在邮件系统中,如果学习者A给学习者B发送了邮件,则可以建立A指向B的链接;同样,如果B也回复了A的邮件,则可以建立B指向A的链接。学习者之间的这种链接关系类似于网页之间的链接关系[5],因此可以通过PageRank 算法来计算用户的实际影响力,具体步骤如下:

⑴ 将各个学习者假设为网页,将步骤1计算出来的用户的影响力作为每个学习者的初始PR值。

⑵ 如果某个学习者A主动和其他学习者产生了联系,则表示该学习者A的链接出度为该学习者链接到的其他学习者的链接的总和。同理,如果其他学习者和学习者A进行了联系,则所有这些其他学习者都是该学习者A的链接入度。根据PageRank公式⑴计算每个用户的PR值。

⑶ 由于每一次计算都可能会改变用户的PR值,经过20次(Google默认)重复运算后,各个网页的PR值基本达到稳定。

步骤3 根据步骤2得到的PR值进行降序排序,输出排序后的节点编号和该节点的PR值。

根据排序后的编号和PR值就可以准确的知道每个学习者的影响力,从而在每个学习小组中选择影响力高的学习者作为学习领袖。

4 结论

影响力是识别意见领袖的重要指标。本文对在线学习社区中学习者交互行为进行深入分析,在此基础上,综合学习者的正面影响力和侧面影响力构建了在线学习社区学习者影响力模型。基于该模型,并结合PageRank算法设计了学习者影响力识别算法,通过该算法可以在大量的在线学习者中更加准确的识别出影响力较高的學习者作为意见领袖。后续的研究将主要围绕如何更好的通过意见领袖的交互行为进一步加强学习小组成员间的联系和互动,以更好的提升在线学习效果展开。

参考文献(References):

[1] B.D. De Wever, H.V. Van Keer, T. Schellens, M. Valcke.

Roles as a structuringtool in online discussion groups: the differential impact of different roles on social knowledge construction. Computers in Human Behavior,2010.26:516-523

[2] S. Zha, C.L. Ottendorfer. Effects of peer-led online

asynchronous discussion on undergraduate students' cognitive achievement. The American Journal of Distance Education,2011.25:238-253

[3] 张红宇,王坚强,马华.结合社会网络分析和多维特征聚类的学习小组划分方法[J].计算机应用研究,2013.30(3):732-735,741

[4] 王冬,雷景生,李壮.基于PageRank的页面排序改进算法[J].计算机工程与设计,2008.29(22):5921-5923

[5] 吴渝,马璐璐,林茂,刘洪涛.基于用户影响力的意见领袖发现算法[J].小型微型计算机系统,2015.36(3):561-565

猜你喜欢
在线学习影响力
关于公布我刊2020年高影响力论文的通知
让激情更具影响力
天才影响力
黄艳:最深远的影响力
基于学习行为数据的在线学习时间规律探析
信息化环境下高职英语教学现状及应用策略研究
基于混合式学习理念的大学生自主学习能力的培养研究
基于SOA的在线学习资源集成模式的研究
3.15消协三十年十大影响力事件
传媒不可估量的影响力