基于用户画像技术的教育资源个性化推荐服务研究*

2020-01-17 06:35尹婷婷龚思怡曾宪玉
数字图书馆论坛 2019年11期
关键词:画像教育资源个性化

尹婷婷 龚思怡 曾宪玉

(1.西北工业大学教务处,西安 710072;2.西北工业大学图书馆,西安 710072)

教育部印发《国家中长期教育改革和发展规划纲要(2010—2020年)》中明确提出,教育工作者需要关注学生的个性特征和自身特点,倡导积极、主动的个性化学习方式,充分发展学生的潜在优势。但是在长期的教育实践过程中,由于学生自身存在的个体差异性、学习效果的不同及学习状态的变化等因素[1-2],教育工作者很难全面、准确地了解学生所需要的教育资源,难以针对学生的不同学习需求进行教育资源个性化推荐服务。同时,随着“互联网+”、大数据等信息技术的快速发展,网络空间内的信息量呈爆发式增长,为个性化学习的实施提供了大量的、更加便捷的学习资源,然而海量的教育资源极易导致诸如“信息拥塞”“信息过载”等现象的发生,如何顺应学习者个性化学习需求的研究背景,针对学习者的差异性从复杂、海量的信息资源中搜索、定位并推荐学习者所需的教育资源,进一步提升教育资源个性化推荐服务的智能性和精准度,目前已成为当今国内外教育管理领域众多专家和学者研究的热门话题和关键问题。因此,构建一种准确率更高、更加智能化的教育资源个性化推荐系统是目前亟待解决的问题。用户画像作为大数据背景下资源信息推荐服务的设计工具,为教育资源个性化推荐服务提供了新的研究思路。用户画像模型的构建主要是针对用户个人信息特征及在网络交互系统内产生的行为记录信息进行数据挖掘,通过数据信息的发现与数据的提炼过程,预测用户的资源需求,最终推荐满足用户需求的、准确的资源信息[3-4]。本文借鉴在信息科学、人工智能等领域的应用实践,引入用户画像技术来探讨、分析教育资源与学习者资源需求之间的内在联系,深入挖掘教育资源个性化推荐服务的本质特征,构建教育资源个性化推荐服务模型并探讨与之相关的教育资源个性化推荐服务的具体应用模式,为大数据背景下高校开展教育资源个性化推荐服务和满足学习者多粒度个性化学习需求提供参考。

1 用户画像概述

网络工程师Cooper提出用户画像是建立在一系列属性数据之上的用于描述目标用户的虚拟模型[5],算法的核心步骤包括对用户个性特征、网络行为痕迹等数据信息进行深度挖掘与归纳分析,利用信息识别及数据挖掘等人工智能技术完成用户贴“标签”的建模过程,将获取的“标签”按照一定的排列组合方式汇聚起来,从而达到快速、精准地了解用户个性化需求的目的[6]。因此,用户画像多用于信息资源推荐服务及精准营销等应用领域[7]。Gauch等[8]提出通过加权关键词、概念层次结构对用户画像的标签系统进行细化分类的观点。Xu等[9]通过用户画像技术提取隐藏在社交网络中微博用户的轮廓特征,并将其用于微博用户资源需求的推送服务。张壮等[10]通过引入注意力机制,利用Stacking集成方法提出改进的多模态融合用户画像方法。Jiamthapthaksin等[11]基于ANN和SVM算法构建用户画像的兴趣特征模型,并利用Facebook数据集验证模型的有效性。周文静[12]提出将加权概念兴趣、加权关键字兴趣用于用户兴趣维度画像模型的构建,并针对校园网络用户画像的数据来源进行实证研究。Quintana等[13]基于用户体验设计理念,提出用户画像技术在MOOC教育资源精准推送服务过程中的设计需求。纵观学术领域关于用户画像的研究成果,发现其研究的侧重点主要集中于用户模型的不同构建方法以及具体的资源精准推送模式等内容,而关于用户画像技术在教育资源个性化推荐服务中的研究仍需进行深入探讨。

2 教育资源个性化推荐服务研究现状

以学习者具体的学习需求为导向,通过对学习者个性特征的描述、学习需求的识别、提供教育资源个性化推荐服务,其实质体现了以学习者为中心的现代教育理念,这也是当前大众泛化学习情况下教育资源个性化推荐服务的发展基础[14]。在“互联网+”信息时代背景下,依据用户的个性化需求,信息科学、教育管理等领域的众多研究者进行大量理论与实践探索,通过对信息资源进行收集、整理、归纳和分类,并向潜在用户推荐其可能需要的教育资源数据,资源推送的具体流程如图1所示。具体而言,Brusilovsky[15]通过将课程进行排序标记,提出教育资源个性化推荐策略的实现路径。Weber[16]在个性化学习导航策略视角下提出教育资源个性化推荐系统的适用范围。DeBra[17]通过对学习者认知水平的探讨,构建针对不同认知水平的教育资源个性化推荐模型。Multimedia[18]利用关联规则分析学习者个性化学习需求的差异性。Wang等[19]利用协同过滤技术提出获取学习者浏览教育资源网页行为数据信息的方法。余胜泉等[20]通过系统建模与构建推荐算法建立智能化的学习元平台资源推荐模型。查相虹等[21]利用数据分析技术设计智能化、人性化的支持服务模型,并对在线学习支持服务应用模式进行探讨。薛伟[22]分别从教学策略、学习策略不同方面入手,对包括教育资源在内的学习支持服务的内涵进行了详细阐述。刘海鸥等[2]基于大数据画像的视角提出学习者多维标签系统构建的模型,并用于个性化学习精准推荐服务模式的研究。

图1 教育资源个性化推荐流程图

纵览人工智能、教育管理等领域教育资源个性化推荐服务的研究成果,发现主要集中于将不同的算法和应用平台引入针对学习者资源需求分析的推送服务等具体内容,包括个性化学习资源导航、学习者认知建模、语义框架分析及智能代理等最新大数据处理技术的应用,但是缺乏对学习者个人信息特征及在网络交互系统内产生的行为记录信息的考虑与研究,从而导致对学习者个人属性特征研究不够,对学习者的兴趣偏好分析不深,教育资源个性化推荐服务不够精准等问题。因此,本文借鉴用户画像技术在金融、互联网等领域广泛应用的实践经验,将用户画像技术引入教育资源个性化推荐服务领域,利用用户画像的技术优势构建教育资源个性化推荐服务模型,为“互联网+”背景下教育资源个性化推荐服务研究提供参考借鉴与发展思路。

3 基于用户画像技术的教育资源个性化推荐服务模型构建

在大数据背景下,学习者的数据信息具有多维、交叉融合的特征,基于用户画像技术构建教育资源个性化推荐服务模型需要利用聚类耦合分析、深度挖掘等相关数学方法完成针对学习者数据信息的分析、处理过程,具体步骤主要包括:通过对学习者个体属性及行为痕迹数据信息的分析、整合、聚类等操作,全面获取学习者的数据信息,建立关联规则;整合、统一学习者个体及学习者群体数据信息;建立多维学习者标签系统,完成用户画像的核心步骤;利用统计分析与数据分析算法,构建用户画像模型,实现教育资源与学习者之间的精准匹配,对学习者提供教育资源个性化推荐服务[6]。

3.1 全面获取学习者的数据信息,建立关联规则

随着“互联网+”技术的飞速发展以及智慧校园网络信息化的全面普及,高校教学管理系统能够对体现学习者个性特征的数据信息进行获取、保存。利用用户画像技术对获取的学习者数据信息进行挖掘、分析并与教育资源进行匹配,从而能够提供精准的教育资源个性化推荐服务。由于物理存储等原因,获取的学习者数据信息可能分散于不同结构的系统中,以至各数据信息之间的相互关联较弱甚至没有任何关联。因此,按照获取的数据信息内容的差异性,可将获取的数据信息划分为基本固定数据、动态变化数据两大类。其中,基本固定数据主要包括学习者的性别、年龄、职业、职务等基本特征数据信息;动态变化数据主要包括学习者在教育系统中的行为日志数据、交互动态数据等行为痕迹数据,这类数据信息会随着学习者学习内容、兴趣爱好等随时发生变化。

当体现学习者个体特征及网络交互系统内的行为痕迹的数据信息被获取后,描述学习者的基本固定数据和动态变化数据就构成了用户画像数据库的信息来源;当大量的与某一学习者相似的基本固定数据和动态变化数据被获取后,关于某一学习者所属的学习者群体数据库信息来源就建立了,同时不同学习者群体之间的内在关联规则也能够建立起来。由于学习者个体基本固定数据及动态变化数据的更新将影响学习者个体所在学习者群体数据信息的改变,因此,建立学习者群体之间科学、合理的关联规则是提高教育资源个性化推荐服务效率的基础与关键。

3.2 整合、统一学习者个体及学习者群体数据信息

作为构建用户画像模型的数据基础,高校教学管理系统收集到的关于学习者的数据内容具有来源广泛、数量庞杂、结构不一的特点。依据基本固定数据、动态变化数据内容的差异性,可以借助数据分解技术,将获取的数据信息整合、统一分解成为元数据格式,再进行清洗、合并、归纳、整合等数据处理步骤[23],从而获得能够用于用户画像的有效数据信息。在整合学习者个体及学习者群体数据信息的过程中,需要随时剔除无用数据,进一步提高有效数据信息的准确性与利用率,从而提高教育资源个性化推荐服务的精准度。

3.3 针对学习者标签进行处理,构建多维学习者标签系统

通过对学习者信息的标签化处理,能够将学习者及学习者群体的个性特征形象化、具体化。建立学习者及学习者群体标签系统的主要步骤:①获取、记录、提取学习者及学习者群体的数据信息,与典型参照词表系统比对分析,构建用于用户画像技术处理过程的标签词表系统,标签词表的具体内容包括学习者的性别、年龄、兴趣爱好等个人信息特征及在网络交互系统内产生的行为记录信息,如使用学校的教务系统、图书馆信息检索系统等产生的访问信息等;②将获取的标签信息进一步梳理、整合、归纳、合并后,形成不同的标签组,并建立能够用于用户画像处理流程的多维标签系统,完成用户画像的核心步骤,为用户画像模型的构建提供对比基础和参照体系[5]。

3.4 利用数据分析算法,构建用户画像模型

依据获取到的学习者基本固定数据及动态变化数据,借助数据分析算法完成用户画像模型的构建,实现更加精准的教育资源个性化推荐服务。在用户画像模型构建过程中,通过建立向量模型对描述学习者资源需求的数据信息进行科学、有效的描述和权重计算,利用节点表示教育资源,节点大小代表学习者对某一具体教育资源的访问次数,各节点间连线的粗细度代表学习者对教育资源需求的强弱关系。依据得到的教育资源权重值的不同,学习者对某一具体教育资源的需求也得到了具体量化表示。基于上述分析,按照学习者及学习者群体的数据信息分析流程,基于用户画像技术的教育资源个性化推荐服务模型可具体分为数据基础层、数据处理层及数据挖掘层(见图2)。

图2 用户画像模型构建数据流程分析示意图[7]

数据基础层是用户画像模型的根本所在,其所需的学习者基本固定数据和动态变化数据主要来源于学校教务系统、图书馆系统、移动服务平台及其他信息系统等,包括学习者关于信息检索、网页浏览、教育资源收藏及下载、教学评价、关注及互动等具体操作的数据信息。数据基础层整合、贯通各系统服务平台的数据信息,主要起到数据收集、获取的作用。

数据处理层的作用是将学习者基本固定数据和动态变化数据进行整合、处理,利用数据处理技术对获取到的学习者基本固定数据和动态变化数据进行前期处理、数据分析等数据处理步骤,形成数据集群,并对不同类型的数据信息依据权重排序,获得用于用户画像的有序数据集合。

数据挖掘层是用户画像建模的核心层,主要利用通过数据处理层获取的有序数据集合,结合已建立的标签模型库(包括教育资源搜索特性、个人特征、评价、转发、浏览等),利用聚类、关联分析等数学处理方法对学习者及学习者群体进行聚合分析,建立学习者画像库及学习者群体画像库,完成用户画像的构建。最后,针对建立的学习者画像库及学习者群体画像库的具体模型,按照学习者及学习者群体的潜在资源需求及目前资源需求的不同,依次将教育资源数据集合与其进行匹配,并将获取的与用户画像模型相对应的教育资源以可视化方式呈现在教育资源交互平台上(包括资源介绍、资源查找路径、个性化服务等内容),进一步增强教育资源显示的直观性,方便学习者及学习者群体的查找,提高教育资源的利用率,为学习者及学习者群体提供科学、高效的教育资源个性化推荐服务。

4 基于用户画像的教育资源个性化推荐服务应用模式

通过对学习者数据信息的深度挖掘,学习者及学习者群体标签化处理过程、建立用户画像模型、匹配学习者及学习者群体与教育资源数据集合等步骤,能够完成基于用户画像的教育资源个性化推荐服务的整个流程(见图3),因此,本文将分别从优化教育资源的个性化推送、开展学习者群体服务、提供个性化学习路径导航服务等具体层面,提出并设计基于用户画像的教育资源个性化推荐服务的应用模式与实现路径。

图3 基于用户画像技术的教育资源个性化推荐服务流程[7]

4.1 深入分析学习者资源需求,优化教育资源的个性化推送

在实现教育资源个性化推荐服务的整个过程中,针对学习者使用网络交互系统内产生的具体行为记录信息进行数据收集,通过用户画像模型预测学习者可能需要的教育资源,结合关联规则算法不断更新、调整和完善用户画像模型数据库,深入分析学习者对于教育资源的需求,有针对性地进行深度挖掘与数据分析,进一步提高教育资源个性化推送的精准度,操作步骤包括使用学习者标签标记学习者特定、具体的个体属性,提取学习者的个体特征信息并完成针对学习者的标签处理;通过对数据信息进行分析、提炼、归类等处理,将数据信息整合、统一分解成为元数据格式;对学习者及学习者群体感兴趣的教育资源进行深度挖掘,获得教育资源数据集合;匹配学习者及学习者群体与教育资源数据集合,建立学习者标签系统与教育资源的关联规则,当学习者选定某知识点后,系统主动为学习者推荐符合其学习风格与兴趣偏好的教育资源,实现教育资源的精准推送,从而进一步优化教育资源个性化推送服务的流程。

4.2 针对学习者群体,开展个性化推荐服务

在教育资源个性化推荐服务服务过程中,由于学习者及学习者群体对于教育资源的需求可能是动态变化的,教育资源监控系统需要同步更新并及时引用动态变化的数据信息,完成对学习者群体关于教育资源需求的精准描述与分析。因此,教育资源个性化推荐服务应用模式的创新可以从总结、提炼相似学习者群体的属性特征及对教育资源的偏好角度入手,虽然学习者个体的教育资源信息需求可能是动态变化的,但是学习者群体的属性特征及对教育资源的需求偏好变化幅度相对而言较小,有利于教育资源系统依据相似学习者群体的属性特征及对教育资源的偏好信息,针对学习者群体开展教育资源个性化推荐服务。

4.3 基于用户画像模型,提供个性化学习路径导航服务

个性化学习路径导航服务主要是根据学习者不同的学习习惯、学习需求和其他学习特征信息,为学习者提供个性化学习方案的服务路径。具体而言,在教育资源个性化推荐服务中,依据用户画像建模过程中获取的动态更新信息,分析、识别出学习者不断变化的兴趣点,结合其学习需求,科学预测学习者下一步的学习规划与可能需要的教育资源,从而为其提供个性化的学习路径导航服务。个性化学习路径导航服务具体的实现流程主要有:通过对学习者数据信息的深度挖掘,对学习者教育资源需求数据信息进行分析处理;对教育资源进行分类、归纳、整理、提取操作,完成教育资源特征标识的处理过程;对学习者画像模型与教育资源信息进行关联操作,同时生成学习者群体关于教育资源需求的相似集合;借助语义关联技术分析教育资源之间的内在联系,获得学习者现有的知识储备和新的学习需求之间的关联关系,从而为不同学习者提供个性化学习路径导航服务。在个性化学习路径导航服务过程中,由于教育背景、学习兴趣和学习能力的不同,需要教育工作者充分了解学习者不同的学习特征并针对用户画像模型建立过程中的动态变化数据及时进行修正与处理,确保推荐的学习路径与学习者需要的教育资源的一致性。

5 结论

在“互联网+”环境下,用户画像技术可以精准描述学习者及学习者群体的个性信息特征,通过深入挖掘学习者及学习者群体的教育资源需求,与教育资源数据信息进行匹配,从而完成教育资源个性化推荐服务的整个流程。但目前就用户画像技术在教育资源个性化推荐服务领域的发展现状而言,仍面临诸多难题与挑战,如如何有效提高教育资源数据的利用率,如何科学、全面地描述学习者群体的相似性与差异性等具体问题。因此,在后续的研究中,仍需深入研究学习者及学习者群体数据信息有效转化问题,科学预测学习者群体对教育资源需求的发展趋势,为教育资源个性化推荐服务的精准实现和满足学习者多粒度个性化学习需求提供理论支撑与技术保障。

猜你喜欢
画像教育资源个性化
威猛的画像
“00后”画像
画像
坚持个性化的写作
整合校外教育资源 做好青少年道德教育
上汽大通:C2B个性化定制未来
面向数字化教育资源的Flash到HTML5转换研究
自主学习视角下的开放教育资源文献综述(上)
同桌宝贝
满足群众的个性化需求