基于用户画像的智慧图书馆个性化服务研究

2020-01-07 00:45李春秋
阜阳职业技术学院学报 2020年4期
关键词:用户画像个性化服务智慧图书馆

李春秋

摘  要:对用户的属性和行为特征进行深入刻画,构建用户画像应用于图书馆服务,可以提高图书馆服务的个性化、精准化。本文结合智慧图书馆的特点,探索智慧图书馆用户画像构建过程,从数据采集层、数据挖掘层、个性化服务层几个方面搭建图书馆个性化服务框架,并针对智慧图书馆个性化服务过程中存在的问题提出相应对策。

关键词:用户画像;智慧图书馆;个性化服务;大数据

中图分类号:G252           文献标识码:A           文章编号:1672-4437(2020)04-0069-04

1 相关理论研究

1.1 智慧图书馆

智慧图书馆最早由芬兰奥卢大学图书馆 Aittola 等人于2003年提出,被解释为“能够被用户感知,且不受空间限制的移动图书馆”[1]。2009年IBM提出智慧地球理念后,智慧图书馆的实践和理论研究才逐渐受到学者的重视。目前我国学者从不同角度对智慧图书馆进行研究,形成不同观点。董晓霞[2]等认为智慧图书馆是数字图书馆和感知智慧化两者相结合。曾子明[3]等认为情景感知能有效提高智慧图书馆移动视觉检索准确率,提高查询相关度和用户满意度。覃玮境[4]等提出了重构智慧图书馆“智能服务”路径,以满足图书馆用户“个性化”与“定制化”的知识服务需求。曹树金[5]等总结了国内外智慧图书馆的参考文献,分析结果认为智慧图书馆应当以大数据、人工智能等技术为支撑,以精准识别读者需求为起点,重视读者体验。

1.2 用户画像

用户画像是Alan Cooper最早提出的,他认为用户画像是建立在一系列真实数据之上的目标用户模型[6]。余孟杰[7]认为用户画像就是利用大数据技术收集足够的数据,然后对用户标签化以形成一个虚拟用户全貌。刘海[8]等根据用户的理财偏好,消费层次以及个人财富等维度构建用户画像,为银行理财产品进行精准营销提供依据。王洋[9]等利用大数据技术对用户的日常浏览日志进行数据挖掘分析,根据分析结果构建用户画像,在准确性方面有了很大提高。王顺箐[10]利用读者兴趣偏好构建用户画像,并融入到图书馆推荐系统中,从而提高了推荐系统的服务准确度。

智慧图书馆的发展趋势是以用户的需求为根本,能够为用户快速、准确地提供个性化、定制化、智慧化服务。可以从阅读推荐和检索推荐两个方面提升个性化服务水平。

2 智慧图书馆用户画像构建

2.1 用户画像数据获取

在大数据时代,移动終端和物联网技术的快速发展,用户的大量数据得以有效保存,为我们采集用户数据提供了基础。利用这些数字资源可以了解用户的特征属性信息,进而对用户群体进行画像。用户画像数据一般情况下可以分为动态数据和静态数据。用户到馆活动轨迹、图书馆相关系统的使用记录、借还书的相关记录等称为动态数据。而静态数据一般可以理解为用户注册时相关信息及家庭和职业等数据,这些数据一般不会实时变动。

智慧图书馆应该采集读者静态数据:基本属性(姓名、性别、年龄、学历……),社会属性(家庭成员、工作单位、工作收入……);动态数据:读者的线下行为(借书记录、预约记录、还书记录……),读者线上行为(读者ID、检索记录、下载记录……)及情景信息(读者的位置、移动终端设备、读者的喜怒哀乐……)。并利用这两方面数据构建用户画像。一般情况下,可以从读者的静态属性中推测出读者的潜在需求。利用读者的动态数据,如互动信息中的评价、建议和讨论等信息,去调整推荐和检索模型以便为读者提供更加个性化的服务。

2.2 用户画像模型构建

用户画像模型构建就是对用户进行标签化的过程。用户标签就是对用户特征信息进行高度总结和概括。完成标签化处理后,对用户进行分类,并标注不同类别的关系,从而形成不同群体的标签体系。本文根据读者的基本属性,社会属性,线下行为,线上行为,情景信息等进行分类整理,构建用户画像模型,如图1所示。

虽然个体画像能全面反映一个独立个体的特征属性,在知识推荐和检索方面也更加精准,但是个体用户数据一旦缺失或者关键属性字段不完整,很难采取其他措施补全数据,进而造成用户画像构建出现偏差。

根据共同兴趣和近似偏好对用户进行分类,构建群体用户画像,在个别用户信息出现缺失时,就可以依据相同类别中的其他用户数据进行评估补充数据,从而完善用户数据。可以先计算用户属性的相似度或紧密度,然后运用聚类算法对群体画像聚类,形成不同类别的群体画像。

3 基于用户画像的智慧图书馆个性化服务框架

可从数据采集层、数据挖掘层、个性化服务层三个方面构建智慧图书馆的个性化推荐和检索服务框架,如图2所示。

3.1 数据采集层

数据采集层是整个智慧图书馆个性化服务框架的基础,只有完整地采集用户的信息数据,才能准确描述用户特征。对于读者的基本信息数据,可以通过图书馆注册信息获取。线下行为数据可以通过图书馆后台数据库提取。同时,读者参与图书馆组织的相关活动也能反映读者的习惯和偏好等。线上行为数据可以通过网络爬虫技术对读者经常登录的网页、微博、微信等信息进行捕获。情景信息数据可以通过定位系统、智能监控、人脸识别等技术采集,实现对读者情景内容的描述。

3.2 数据挖掘层

数据挖掘层需要对数据采集层采集到的原始数据进行预处理,也就是说需要对重复数据、缺失数据等情况进行处理。另外,由于读者属性较多,且对读者影响不一。因此,需要对读者属性进行降维和加权处理,对提取的主要特征信息进行标签化,形成读者属性标签库。从采集的数据来看,数字资源呈现数据量大、变化快、异构化、多来源等特点,这些数据在个性化推荐服务之前还需要进行语义标注和关联,形成标准语义库。

鲁棒性强的算法模型是实现智慧图书馆个性化服务的关键。根据提取的特征标签库初步形成个体用户画像,然后通过数据挖掘技术进行聚类分析,从而形成群体画像。画像模型可以快速地对用户特征进行描述和表达,进而与检索对象进行知识匹配关联。关联度越高,越能准确地锁定知识目标。目前,常用的检索模型和推荐模型有多种,如文本搜索、视觉搜索和协同过滤推荐、混合推荐等,在进行个性化检索和推荐时,需要选择合适的检索和推荐模型。

3.3 个性化服务层

读者在移动终端进行检索查询服务时,智慧图书馆后台服务器会根据读者画像进行计算,从而选择最适合读者的推荐模型,对检索的知识和内容进行可视化处理后,推荐给读者。同时,智慧图书馆还能够感知读者当前的情景信息,通过和读者互动交流,实时调整用户特征属性,根据新的属性数据来抽象新的标签,并把新的标签添加到标签特征库,从而不断完善读者画像,调整推荐模型和检索模型,提高读者对智慧图书馆个性化服务的真实体验。

4 存在的关键问题与应对策略

4.1 数据采集完整性及标签粒度划分方面

用户画像构建过程中,数据采集越全面,构建的用户画像就越精确。但是在搜集数据时会遇到一些问题,如个别读者注册信息不完整,或者填写的信息有误。尽管通过相似偏好对个人信息进行处理,在个性化推荐和检索时也会出现一些误差。这就要求后期必须强化数据采集的完整性。

标签粒度划分问题是用户画像构建过程中一定会遇到的问题。粒度划分过于精细,会出现过度描述的现象,粒度划分过于粗放,又难以精确描述用户,这两种情况都会出现推荐模型选择使用度低的情况。一方面,有些特征属性标签重要程度低,对用户影响较小,这些标签如果留在用户特征属性标签库中,用于用户画像构建,会造成用户画像构建不够精准,在进行知识推荐和检索时,会导致推荐和检索的知识非用户所需知识,偏离用户期望。另外,标签数量太多,在选择推荐模型时,会增加服务器端的计算工作量,进而影响推荐检索内容和知识的速度,降低读者的阅读体验。因此,要客观地对用户画像标签粒度划分。可以首先分析标签对用户的重要程度,将标签进行分组,并计算不同组别对用户决策的影响程度,进而设置合理的权重,删除无关紧要的标签,提高用户画像的精确度。

4.2 搜索和推荐算法优化选择方面

随着计算机技术、人工智能的不断发展,智慧图书馆检索方式越来越多样化。每种搜索方式和推荐算法都有各自的优缺点和不同的特征,特别是针对新用户的问题,以及在查询准確率和完整性方面的问题。智慧图书馆的重要特征为用户提供实时服务。因此,需要动态调整用户的阅读和检索习惯,实时调整用户画像,并根据画像及时调整检索和推荐模型,向有共同偏好的群体进行知识推荐,提高推荐效率和准确率。

4.3 数据隐私安全方面

大部分用户数据都涉及用户的隐私。因此,在收集、使用用户数据时,应及时做好信息的安全和隐私保护。数据采集前,最好征求读者意见;采集时,尽量只收集一些关键信息和数据,对用户特征属性影响较小的数据,如身份证号尽量不要采集,以免影响信息安全;采集后,要注意用户信息存储安全问题、信息泄露问题及信息被窃取等问题。可利用区块链技术增强智慧图书馆信息的安全性。此外,还需建立健全智慧图书馆管理制度,定期对图书馆馆员进行培训,提高图书馆馆员的个人素质和安全意识,把每个图书馆馆员都培养成智慧型图书馆馆员。

4.4 用户画像动态变化方面

用户的偏好和需求特征不是固定不变的。因此,同一个用户的画像模型也要随着时间推移不断调整。但是用户的行为特征信息和偏好何时变化,难以把握。如果实时更新数据,并对用户画像实时调整,会大量增加终端服务器运算量,造成系统运行缓慢,延迟推荐时间,降低用户使用体验。如果每隔一个固定时间段调整,就需要对用户群体偏好变化的周期性进行深入研究。

针对用户画像的动态变化,终端服务器难以高效的处理海量数据的问题,可以搭建云服务平台,利用云服务器强大的数据处理和计算机能力,将用户画像模型构建以及检索和推荐算法放在云端处理,并将结果通过云端传输,提高推荐系统的实时推荐速度和稳定性,增强用户体验,提高智慧图书馆个性化服务水平。

参考文献:

[1]Aittola M, Ryhanen T, Ojala T.Smart Library :Location Aware Mobile Library Service[J].International Symposium on Human Computer Interaction with Mobile Devices and Services,2003(5):411-415.

[2]董晓霞,龚向阳,张若林,等.智慧图书馆的定义、设计和实现[J].现代图书情报技术,2011(2):76-80.

[3]曾子明,蒋琳. 融合情境的智慧图书馆移动视觉搜索服务研究[J].现代情报,2019(12):46-54.

[4]覃玮境,向立文,左逸群.融合与重构:AI技术驱动下智慧图书馆服务逻辑与路径[J].图书馆工作与研究,2019(3):29-33.

[5]曹树金,刘慧云.以读者为中心的智慧图书馆研究[J].图书情报工作,2019(1):23-29.

[6]张小可,沈文明,杜翠凤.贝叶斯网络在用户画像构建中的研究[J].移动通信,2016(22):22-26.

[7]余孟杰.产品研发中用户画像的数据建模[J].设计艺术研究,2014,4(6):62-64.

[8]孙晔,杨照东,陈德华.大数据用户画像技术在商业银行的应用[J].数字通信世界,2016(9):86-88.

[9]王洋,丁志刚,郑树泉,等.一种用户画像系统的设计与实现 [J].计算机应用与软件,2018(3):8-14.

[10]王顺箐.以用户画像构建智慧阅读推荐系统[J].图书馆学研究,2018(4):92-96.

猜你喜欢
用户画像个性化服务智慧图书馆
把声音的魅力发挥到极致
浅析移动时代的图书馆发展策略
互联网思维下数字图书馆个性化服务建设研究
需求理论在高校图书馆就业服务中的应用研究
移动用户画像构建研究
Beacon技术在图书馆信息服务中的应用研究
基于微博的大数据用户画像与精准营销
论智慧图书馆的三大特点
移动互联网下手机用户使用行为特征的研究
大数据对高校图书馆个性化服务的影响