图神经网络推荐系统综述

2022-10-16 05:50吴静谢辉姜火文
计算机与生活 2022年10期
关键词:卷积神经网络节点

吴静,谢辉,姜火文

江西科技师范大学 数学与计算机科学学院,南昌330038

随着大数据时代的到来,数据结构更加复杂,图神经网络推荐系统是用来处理非欧式数据并以此来提升推荐系统准确度的方法。现实生活中形成的社交网络、知识图谱等都存在大量的非欧式数据,图神经网络(graph neural network,GNN)推荐系统(recommendation system,RS)能达到传统推荐系统所无法达到的效果。尤其在项目与项目、用户与用户、用户与项目以及显性或隐性信息之间的处理上,GNN 推荐系统能够借助非欧式数据,使得推荐结果高质量化。推荐系统目前的主要挑战是如何从用户-物品交互以及辅助信息中学习有效的嵌入信息。其大部分的信息本质上都是图结构,而GNN 在表示学习方面具有先天优势。随着深度学习的发展,作为常见的深度学习模型GNN,其应用于推荐系统方向的研究与日俱增,在推荐方向的应用将成为发展的必然趋势。基于GNN 推荐系统问题的相关研究正受到人们的广泛关注和研究。以往的GNN 推荐方向的综述从GNN 模型的图结构、个人或群体等角度上进行总结归纳,本文最大的创新点在于从方法、问题两个角度切入分析,在近些年来图神经网络的相关研究进行整理的基础上,对图神经网络推荐系统进行深入研究,从两个角度来分析总结基于GNN 推荐系统的最新研究进展,提出GNN 推荐系统当前存在的问题并讨论未来的主要研究方向。

1 推荐系统

推荐系统的核心是通过用户的历史行为、兴趣偏好或者人口统计学特征来得到某种推荐算法,该算法能产生用户感兴趣的项目列表,而该项目列表使得排在前面的物品展示给用户。正因为互联网的发展,推荐系统已经成为互联网产品的标配,而推荐系统的主要目标是发现并建立用户与信息之间的通道。从用户角度来看,推荐系统就是帮助用户找到他们所需要的信息,例如喜欢的物品或服务,还会帮助用户做出决策,并且发现用户可能感兴趣的潜在信息;从信息角度来看,推荐系统可以将特定的信息提供给特定的用户,以此来提供个性化的服务,提高用户信任度和粘性,为商家增加营收。根据推荐算法所用数据的不同分为基于内容的推荐、协同过滤的推荐以及混合的推荐。如图1 所示为推荐系统基本分类。

图1 推荐系统分类Fig.1 Recommendation system classification

基于协同过滤的推荐系统是基于用户-项目的历史交互记录产生推荐,可以是显性反馈(评分、喜欢/不喜欢),也可以是隐性反馈(浏览、点击);基于内容的推荐主要是根据用户和项目的特征信息来进行推荐;混合方法推荐则结合了以上两种不同的推荐方法,即可同时建模静态特征与动态交互。在基于协同过滤的推荐系统上,图神经网络属于基于图的模型。

2 图神经网络推荐系统方法

图神经网络借鉴了卷积神经网络、循环网络和深度自编码器的思想,目的是为了扩展现有神经网络,定义和设计用于处理图形结构数据的神经网络结构。尽管在提取欧氏空间数据的特征方面,传统方法取得了巨大的成功,但图神经网络既可以利用图来反映对象之间的复杂关系,还可以对非欧氏空间生成的数据进行特征提取和表示。它在学习图形结构数据方面表现出了更强大的功能。正因为GNN在图学习上的优越性能,它被广泛运用于推荐系统。除此之外,它也被应用到许多领域,如文本分类、自然语言处理、疾病预测、特征关系提取等。

对于推荐系统来说,一般推荐系统包括三个阶段,分别是匹配、排序和再排序。图神经网络的原理主要是:首先构建图结构模型来反映实体和实体之间的关系;再利用特定的方法对节点进行描述并得到包含最终的邻居节点信息和拓扑结构特点状态的节点,该节点已经进行了不断的更新迭代;最后将通过某种特定的方式输出这些节点的表示形式,并获得所需要的信息。而对于GNN 推荐系统来说,其主要阶段和图神经网络过程接近,一般只分为四步:(1)根据实体相互关系建立GNN 模型;(2)决定GNN模型的信息传播与更新方法;(3)提取出更新后的节点特征;(4)选取算法实现推荐。本文基于图神经网络推荐系统的方法主要分成了五大类。图2 表示了GNN 推荐系统主要的五大分类。

图2 GNN 推荐系统分类Fig.2 Taxonomy of graph neural network-based recommendation system

2.1 图卷积网络推荐系统

图卷积网络(graph convolution networks,GCN)是将卷积运算从传统数据推广到了图数据,如图3所示。

图3 图卷积原理图Fig.3 Principle diagram of graph convolution networks

该图是使用深度为2 的卷积模型。左边是一个小的输入图示例,右边为两层神经网络。该网络使用节点及其邻域()(节点、、)来计算节点的值。

在基于图卷积神经网络推荐系统的算法中,一部分算法并不会直接使用GCN 方法,而是将GCN 与图嵌入融合在一起,从而提升了整个模型的效率。事实上,GCN 与其他四类也进行了融合,创造了许多成果。在最近的文献研究里,更多的是处理大规模的数据。文献[11]提出了一种基于高效的随机游走方法来构建卷积模型,并设计了一个新颖的训练策略来改善模型的鲁棒性和收敛性。其在基于图卷积架构的推荐系统上,能解决数亿级别用户的Web 推荐任务,但不足之处在于不能解决其他大规模的图表示学习问题。对于处理大规模数据的计算和内存问题上,Chen等提出了一种基于混合内存计算(computation-in-memory,CIM)结构的图卷积网络的有效分配方法。该方法还解决了图卷积网络在应用中的不规则数据的访问问题。CIM 结构上优化了GCN 的任务分配,为GCN 推荐系统上数据处理提供了一个解决方案。同样地,对于处理和训练复杂的大规模异构图数据上,Tran等则开发了一个基于GCN 原理的新的框架——HeteGraph(graph learning in recommender systems via graph convolutional networks)。其通过一种抽样技术和一个图卷积运算来学习高质量图的节点嵌入。这个与传统的GCN 不同,后者需要一个完整的图邻接矩阵来进行嵌入学习,而该框架是设计了两个模型来评估推荐系统任务,即项目评级预测和多样化项目推荐。该方法主要是应用于大规模异构图数据的推荐问题,但仅适用于两个实体,即用户和项目。进一步来说,Shafqat等将用户-项目点击交互作为概率分布,并使用该值度量节点之间的相似度。该方法采用了两个不同节点之间的相似性度量来事先对邻居进行采样。这种方法简化了GCN 模型的邻居抽样任务,提高了训练效率,降低了复杂度和计算时间,但需要形成会话图,并不适应于所有推荐系统场景。对于异构图数据,不同于Tran等方法,Yin等提出的基于异构信息网络的高效推荐算法是利用图卷积神经网络自动学习节点信息的特点,提取异构信息,并融合异构信息的计算策略和评分信息融合策略解决节点评分问题,通过更新节点,减小了训练规模,提高了计算效率。除了数据量的问题,关于可解释性上,同样地利用了用户和项目两个实体,Chen等将知识图(knowledge graph,KG)引入到推荐系统来提高可解释性。他们提出了一种基于KG 的交互式规则引导推荐(interactive rules-guided recommender,IR-Rec)框架,主要是从增强的KG 中提取用户-项目之间交互的多条路径,再从潜在动机角度将这些路径归纳出一些公共行为规则,通过这些规则来确定推荐的潜在原因。根据用户、项目和规则设计了图卷积网络等不同神经网络来学习嵌入表示。Bonet等给出了一种时间协同过滤(temporal collaborative filtering,TCF)方法,利用GNN 学习用户和项目表示,并利用递归神经网络建模。该方法为了解决数据稀疏性,使用每段时间累积的数据来训练GNN,提高了推荐系统的性能,但其侧重于提高推荐的准确度,忽视了推荐系统的可解释性,且无法应对数据样本量稀少的情况。

2.2 图注意力网络推荐系统

图注意力网络(graph attention network,GAT)是一种基于空间的图卷积网络,它在聚合特征信息时,将注意力机制用于确定节点邻域权重。它能够放大数据中最重要部分的影响并且能够自适应地学习邻居节点权重。但是,计算成本和内存消耗会随着每对邻居之间的注意权重的计算而迅速增加。这也是基于GAT 推荐系统的难题。

基于GAT 推荐系统的研究比较丰富。社交关系是GAT 应用的主要因素。Song等提出了用于在线社区基于会话的社交推荐的动态图注意力神经网络(dynamic-graph-attention neural network)模型。同样地,Jiang 等人也认为社会关系能优化推荐系统,由此将社会信息融入到图卷积网络中的嵌入邻域聚类中,利用用户-项目交互图和社会关系图来捕捉用户的项目品味和用户朋友之间的关系。他们设计了一种新的框架——注意力社会推荐系统(attentional social recommendation system,ASR),通过两个注意力机制分别研究节点的邻居权重以及交互图和社交图之间的语义贡献,并利用分层图注意力卷积网络使SAR 能自适应地探索更高阶的交互和社会邻居,以构建更好的嵌入表示。但是,ASR 设置了两个注意力机制而使模型更加复杂,往后需要有效、合理地简化GAT。在社会关系的另一方面,对于利用社会信息解决传统协同过滤中的数据稀疏性和冷启动问题,Wu等提出了能够学习二重社交影响的对偶图注意力网络(dual graph attention networks for modeling multifaceted social effects in recommender systems,DANSER),它包括两个对偶的图注意力网络,以学习推荐系统中社会效应的深层表征,利用了特定用户的注意力权重和通过动态并能够感知上下文的注意力权重来建模。不同于大多数的模型,它并没有假设好友的社会影响是固定静态的。而在上述文献中,文献[18,20]都有考虑到用户的动态性,而文献[19]仅仅利用了其他信息来关联一些隐性信息。实际上,许多社会研究和实践案例表明,人们的消费行为和社会行为不是孤立的,而是相互关联的。一些隐性信息也值得挖掘。Xiao等基于图神经网络、注意机制和互补模型,创造出了一种新的框架——MutualRec(joint friend and item recommendations with mutualistic attentional graph neural networks),用于联合建模社交网络中的用户偏好和社交交互。这种框架使用了空间和频谱注意力神经网络层来获取用户的偏好特征和社交特征,再通过互补模型中的关注层将两个特征融合在一起,同时解决了社交推荐和链路预测任务。该模型具有一定局限性,可以结合知识图来推荐,进而更好地使前两层缓解数据稀疏性。而Dang等首次提出了一种将知识图和知识表示引入到Web服务推荐中的深层知识感知方法,并提出了一种深度知识感知的Web 服务推荐框架(deep knowledge-aware approach for Web service recommendation,DKWSR)。该框架还加入了注意力机制来模拟当前候选项目的标签对组合项目表示的影响。这解决了因用户调用有限数量的服务而导致的数据稀疏性和冷启动问题,并提高了推荐结果的可解释性。Li等为解决数据稀疏和冷启动的问题,利用图的边信息创造出了一个名为GSIRec(graph side information for recommendation)的深层端到端推荐框架。其利用了图注意力神经网络来增强推荐。Salamat等通过将社会网络建模为一个异质图,利用带注意力机制的GNN 智能聚合来自所有来源的信息,并提出了一种新的基于图的推荐系统Hetero-GraphRe(heterogeneous graph-based neural networks for social recommendations)。该系统提高了模型的可解释性,但未考虑社交网络的动态行为。以上的文献方法都能有效解决数据稀疏和冷启动问题,但由于文献[24]需要获取了大量的信息,那么如何进行高效的数据筛选从而捕获有用的信息也是一个大的挑战。众所周知,KG 能有效地缓解数据稀疏性,但基于KG 的推荐系统不能自动捕获实体对推荐的长期依赖关系,Sang等提出了一种双通道神经交互方法——知识图增强神经协同过滤残差递归网络(knowledge graph enhanced neural collaborative filtering with residual recurrent network,KGNCF-RRN)。该方法能捕捉丰富的语义信息,还能捕捉用户与项目之间复杂的隐含关系,用于推荐。这也为捕获隐性信息提供了方法。

2.3 图自动编码器推荐系统

图自动编码器(graph autoencoders)是一类图嵌入方法,典型的用法是利用多层感知机作为编码器来获取节点嵌入。其目的是利用神经网络结构将图的顶点表示为低维向量。Kipf 与Welling 在2016 年提出了基于图的(变分)自编码器——VGAE(variational graph auto-encoder)。自此开始,图自编码器在很多领域都派上了用场,例如脑电路图、多视图、社交网络等。

在隐式关系上,文献[29-32]各自提出了模型,但区别在于一个是捕捉图结构下的隐式信任关系,另一个是捕获隐式数据之间的关系。Zheng等提出了一种基于变分自动编码器(variational auto-encoder,VAE)的隐式信任关系感知社交推荐模型(implicit trust relation-aware model,ITRA)。ITRA 采用注意模块将加权信任嵌入信息反馈到继承的非线性VAE 结构中。模型可以通过重建一个包含间接关键意见领袖和邻居显性联系的隐式高阶交互的非二进制邻接社交矩阵进行推荐。而典型的模型通常将用户信任关系描述为从社交图中导出的二进制邻接矩阵,基本上只包含邻域交互,然后用相同的值对不同个体的信任值进行编码。这种方法无法捕捉隐藏在图结构下的隐式高阶关系,因此忽略了间接因素的影响。而Yao等提出了相关瓦瑟斯坦自动编码器(correlated Wasserstein autoencoders,CWAEs)模型,通过无向无环图来表示数据,利用现实世界数据通常相互关联的特点,以提高推荐性能。更进一步地,Deng等提出了一种混合的HybridGNN-SR(combining unsupervised and supervised graph learning for session-based recommendation)模型,将无监督图学习和有监督图学习相结合,从图的角度来表示会话中的项目转换模式以此捕捉节点特征的图形结构数据。具体说,在无监督学习部分,提出将变分图自动编码器和互信息相结合来表示会话图中的节点;在监督学习部分,使用一种路由算法来提取会话中较高概念特征进行推荐。这种算法考虑了会话中的项目之间依赖关系。文献[32]则是开发了一种考虑用户偏好的监督多变量自动编码器(supervised multivariational autoencoder considering user preference,SMVAE-UP),可以提取内容特征之间的关系,从而获得偏好感知的多通道特征。这样可以从大量帖子中为每个用户个性化推荐帖子,但是该训练时间具有局限性,使用了Intel Core i77800X,NVIDIA Quadro GV100和32 GB RAM的计算机,所有用户训练SMVAE(supervised multi-variational auto-encoder)的总时间为33.5 h。如何更高效、更简洁地处理大数据,从而挖掘隐式关系,是需要考虑的问题。

2.4 图生成网络推荐系统

图生成网络(graph generative networks)是给定一组观察到的图的情况下生成新的图。图生成网络的方法都是基于特定领域,例如:分子图生成、自然语言处理等。一些方法是将生成过程看作交替生成节点和边,另一些方法是利用生成对抗训练。在最近的研究中,图生成网络正在被深度学习彻底改变,其应用广泛,尤其是药物中的分子生成等方面。而在推荐系统的生成图上,新节点连通性与现有图的冷启动问题一直存在。例如用户属性,如性别、教育等存在着大部分缺失信息,使得个性化推荐任务遇到一定问题。Zhou等提出一种基于对抗性VAE 的属性推断模型(infer-AVAE)。该模型将多层感知器和GNN 结合,学习正负潜在表示,还将引入互信息约束作为解码器的正则化器,以更好地利用表示中的辅助信息并生成不受观察限制的输出表示,但其还是会出现过拟合和过度平滑问题。对稀疏性数据,很容易产生过拟合现象。尽管在学习图表示和图生成方面出现了一些新的文献,但是由于学习过程严重依赖于拓扑特征,从而导致大多数的图表示和图生成方法大都不能处理孤立的新节点。在这方面,Xu等提出了一个统一的生成图卷积网络模型,该模型通过对观察到的图形数据构造的图生成序列进行采样,自适应地学习生成模型框架中所有节点的节点表示。此模型是将图表示学习和图卷积网络结合到一个顺序生成模型,该方法在增长图的链接预测上优于其他方法。然而,因为计算复杂性取决于完整图的大小,可伸缩性仍然是一个主要问题。大多数研究还会结合对抗神经网络、卷积神经网络构成图生成对抗神经网络。例如,Wu等提出了一种新的基于图卷积的生成先令攻击(graph convolutionbased generative shilling attack,GOAT),部署了一个生成性对抗网络(generative adversarial network,GAN),其生成器还结合了一种图卷积结构。该方法是为了探索推荐系统的稳定性,进而提出了先令攻击模型。此推荐方法只适用于对基于评论等内容的推荐。同样是结合对抗神经网络,Zhang等提出了一种新的全局仿射和局部特定生成对抗网络(globalaffine and local-specific generative adversarial network,GALS-GAN),用于显式构造全局语义布局和学习不同的实例级特征,解决了合成细粒度纹理和小规模实例的困难。可见,图生成网络推荐系统开始和卷积神经网络或对抗神经网络进行了一定程度的融合。受到深度学习和强化学习最新进展的启发,有些人开始利用图的深度生成模型结合注意力机制来生成模型。不过,这些推荐系统仅仅是想生成有用且有效的信息,并没有考虑到兴趣会随时间变化,当图变大时,对长序列建模就变得困难了,而且这些方法都不能扩展到大的图,其性能还有待提升。

2.5 图时空网络推荐系统

图时空网络(graph spatial-temporal networks)同时捕捉时空图的时空相关性,它利用时空图来建模。时空图具有全局图结构,每个节点的输入随时间变化。图时空网络的目标可以是预测未来的节点值或标签,或者预测时空图标签。它常用于交通流量预测方面。最近的研究常结合深度学习使用时空图卷积网络(spatial-temporal graph convolution networks,ST-GCN)来提取空间和时间维度上的特征。例如Park等设计的生成性对抗网络框架,它从一组带有样式标签但未配对的运动剪辑中学习风格特征,以支持多个样式域之间的映射,而以往多采用单一维度,例如利用时间轴来提取数据风格特征,无法表现空间动态的运动。虽然该文献中的框架能提取空间和时间两个维度的特征,但其对随机噪音十分敏感,适合少量已经标好明确样式标签的数据。对于涉及时间动态和属性交互上,一般算法通过时间线分割不同的时间窗口,但不适用于有交互行为的数据,还不能完全处理异构节点数据。Zhang等提出了一个新的框架TigeCMN(temporal interaction graph embedding via coupled memory neural networks),从一个序列的时间相互作用中学习节点表示。该框架也可以结合机器学习任务,适用性广,但仅仅考虑了二部图,未扩展到多部异构图而且训练过程中提取数据是均匀抽样,其实用性较差,具有很大的改进空间。杨珍等提出了该方向的专利,通过建模时序信息的GCN,再分配给周围邻居的时序注意力权重来探索时序信息,提高了推荐系统的性能。但该方法只能用于购物商品推荐,具有一定的局限性。与传统推荐任务不同,由于POI(point-of-interest)推荐具有个性化、空间感知和时间依赖性,图时空网络推荐系统常应用于POI 推荐。已有文献尝试对空间和时间特征建模,但大多存在以下两大局限性:一方面,在空间上现有作品只考虑了用户和POI 的距离或者POI-POI 距离,不能发现用户区域周期偏好;另一方面,在时间上大多数文献将用户和时间视为两个独立的因素,没有发现不同用户可能在不同的时间偏爱相同的POI。Han等对此提出了多个利用用户区域周期模型和用户POI 周期模型的评分函数,还开发了一个时间平滑策略来缓解数据稀疏性问题,但未能考虑到时空序列节点之间的上下文信息。

总体而言,在以上五类基于图神经网络推荐系统研究中,如表1 所示,图卷积与图注意力神经网络依旧是热点,GCN 能够和其他四类进行嵌入获得新的方法。而图自动编码器很适合发现并处理隐式数据,图生成神经网络会利用对抗神经网络成为对抗生成网络,还会结合知识图谱增强数据,减少节点数据稀疏。而图时空网络推荐系统场景基本上是POI任务推荐,由于数据量大,会结合注意力网络和卷积神经网络建模。单独采用图生成网络推荐系统和图时空网络推荐系统文献较少。一方面是计算内存和速度限制了该方向的研究进展;另一方面是图生成网络对于新节点只有节点属性可用,图时空网络中的时空图涉及到空间和时间问题。不过,这也表示了该研究处于研究阶段初期。图生成网络推荐系统和图时空网络推荐系统存在巨大继续研究的空间。

表1 GNN 推荐系统各类别的对比Table 1 Classes comparison of graph neural network in recommendation system

3 GNN 推荐系统问题

由于存在该领域的研究成果不单单属于以上分类,而且从图神经网络角度来看,图卷积神经网络常与其他四类结合来促进推荐系统领域发展,另一方面,推荐系统中的图神经网络开始融合社交网络和知识图谱。虽然Xiang 等在文献[44]已经归纳出了问题类别,但基于图神经网络的推荐系统的范围非常庞大,有些算法和应用很难明确归纳到某一类。而对于有些分类来说,同一分类的问题可以针对不同类型的算法和应用。这里,按照推荐系统一般的场景来划分,把问题分为六类:序列推荐问题、社交推荐问题、跨域推荐问题、多行为推荐问题、捆绑推荐问题以及基于会话的推荐问题。

3.1 序列推荐问题

在真实场景中,通常会使用所有数据来训练模型,但这样会遗漏用户表示中的用户序列行为信息。在最近的研究中,Yang等通过添加一个标签推荐函数建立一个顺序推荐模型。Gu等将项目图嵌入和上下文建模结合到推荐系统任务中去。而

Tao等提出了一种新的序贯推荐方法,从隐式用户交互历史中学习项目趋势信息,并将项目趋势信息合并到后续的项目推荐任务中,利用了门控图神经网络对项目趋势表征建模来提高项目的表征能力。这些提出的方法都提高了推荐系统的性能,但文献[46-47]都是利用历史信息且都采用了注意力机制,只是前者使用的是会话序列信息,后者使用的是用户交互历史。对于隐式信息,Wang等引入知识图,利用用户的隐式偏好表示,整合了递归神经网络和注意力机制,以捕捉用户兴趣的演变和序列中不同项目之间的关系。

3.2 社交推荐问题

社交推荐主要是利用信任或亲密的人所感兴趣的东西,即用户关系链中的推荐内容,进而对用户进行推荐。近些年,在提高社交推荐的精确度上,Guo等关注到了项目特征之间的相关性,将用户特征空间和项目特征空间抽象为两个图形网络。Liu等提出了项目关系图神经网络,用于同时发现多个复杂关系,而且对于不能直接获取的项目或者用户信息提供了解决方案。而Salamat等通过将社会网络建模为一个异质图,利用带注意力机制的GNN 智能聚合来自所有来源的信息,建立用户与用户、项目与项目、用户与项目之间的关系。在关系方面,实体之间还存在着高阶的关系,为了捕获这些高阶的关系,很多文献考虑将知识图谱和用户-项目图进行融合。又因为知识图谱有多重类型的边,所以需要使用注意力机制来聚集来自邻居的信息。在用户信息整合上,一些工作假设用户具有静态的表示,再利用GNN 来学习项目表示;另外的一些工作则将用户作为知识图谱中一种输入数据来学习。例如Wang等对融合后的知识图谱进行嵌入表示,使用注意力机制和递归神经传播邻居节点的嵌入表示来更新当前节点的表示。这些关系在一定程度上解决了图神经网络推荐系统数据的稀疏性问题。

3.3 跨域推荐问题

跨域推荐一般利用原本的数据集来对单个目标进行推荐,有的还考虑到用户与物品之间的双向潜在关系和潜在信息。Yang等将知识图与排序学习、神经网络相结合来构建模型,提出了基于知识图的贝叶斯个性化推荐模型和基于知识图的神经网络推荐模型,可以通过捕获高阶关系来解决个性化问题。文献[56]引入了一种新的耦合图张量分解模型。当单边的信息以项目-项目相关矩阵或图形的形式出现时,它能解释与图相关的边信息。Ouyang等利用相关域的互补信息来缓解稀疏性,实现了基于学习应用嵌入的跨域应用推荐,可以为用户找到符合自己兴趣的应用程序。对于个性化新闻推荐,Sheu等提出了一种基于上下文感知的图嵌入方法,用于新闻的推荐。为了充分利用结构和特征信息,Liang等提出了一种新的异构图神经网络框架——HGNRec(heterogeneous graph neural network framework)。Ma等提出了一个基于图的行为感知网络。由于应用场景不一样,所需信息的量也不同,而知识图谱所捕获的信息量巨大,故文献[55]的推荐模型的运行也较其他场景更复杂。其中文献[58-60]都是适用于新闻推荐应用,但目标不一样,文献[58]强调新闻个性化,而文献[60]则重在多样化。Wang等将标准的图卷积网络引入推荐中,它利用用户-物品交互图来传播嵌入特征表示:

He等则简化了该公式:

上述研究表明模型的简单性带来了更高的性能。Amar针对推荐系统问题提出了一种基于SVD(singular value decomposition)的简单方法的基准测试,以理解进一步简化建模方法是否可以改善性能指标。Liu等采用两个GNN 来处理每个用户/物品的Embedding,其中一个处理偏好,另一个处理相似性。这个带有两个图的模型将GNN 和协同过滤方法进行了融合,使推荐系统达到了更高的精确度。

3.4 多行为推荐问题

在现实中,用户行为不仅仅是单个类型的用户与商品的行为数据,还有复杂的交互关系类型数据,例如:加购、点击、购买、收藏等。Xia等提出了一种基于图形神经网络的多行为增强推荐框架,该框架在基于图形的消息传递体系结构下,显式地建模不同类型的用户-项目交互之间的依赖关系。它还设计了一个关系聚合网络来模拟交互异构性,并递归地在相邻节点之间通过用户-项目交互图进行嵌入传播。它采用了异构图来构建依赖关系,而在交互的时间序列上,Yu等用一种基于图神经网络的混合模型对多行为交互序列进行特征层次的深层表示,从而实现基于会话的推荐。在具体的互动式新闻推荐上,Ma等同时考虑了六种不同类型的行为以及用户对新闻多样性的需求。他们分别从不同角度来解决用户的多行为问题,但方法各有千秋,用户的多行为问题依旧是一个挑战。

3.5 捆绑推荐问题

捆绑推荐经常使用在场景推荐中,由于用户不仅仅与单个物品进行交互,他们希望一次性得到自己想要的产品。那么,怎样才能使用户获得所需的一系列物品,这是一个问题。在法律推荐方面,Yang等构造了一个HLIN(heterogeneous legal information network)网络,它包含了文本信息和各种节点。其基本思想是融合来自多个异构图的交互特征以改进图节点的表示学习,例如user-item 二部图和social关系网络图。Zhang等认为这是第一次将metapath 与social relation 表征结合起来的工作。草药推荐方面,Yuan等将注意机制引入综合症状诱导过程模型。此外,它还引入了中医知识图谱,以丰富输入语料库,提高表示学习的质量。在减轻客户服务压力方面:Liu等通过图形神经网络对一组灵活的服装项目进行建模;Chen等采用时空图进行了动态预测,动态地提供最优的自行车站布局;Yang等添加了一个标签推荐函数,通过点击标签快速捕获用户的问题意图。在舞蹈音乐推荐方面:Gong等提出了一种基于舞蹈运动分析的深度音乐推荐算法,实现了一种新的音乐推荐方法,可以学习动作和音乐之间的对应关系。针对开发人员所需的API(application programming interface)问题,Ling等提出了一种新的API 使用推荐方法GAPI(graph neural network based collaborative filtering for API usage recommendation);Zhang等提出了基于图卷积网络的语义变分图自动编码器,这是一种端到端的方法。对于课程推荐,Zhu等将网络结构化特征与图形神经网络和用户交互活动相结合,采用张量分解技术,提出了一种混合推荐模型。可见,图神经网络推荐系统的实用场景丰富。场景动态性是考虑的重点,时空图和动态图将是研究的主要问题。

3.6 会话推荐问题

在会话推荐系统中,系统通过自然语言和用户进行动态交互,识别出用户的偏好,进而进行物品推荐。一般的静态模型缺乏用户的实时反馈和显式指导,目前研究的会话推荐系统正解决这方面的问题。在基于匿名会话预测用户操作上,Zheng等提出了一种双通道图转换网络的方法,用于模拟目标会话和邻居会话之间的项转换。基于多行为的会话推荐预测下一个项目上,Yu等提出了一种基于图神经网络的混合模型GNNH。与其他模型相比,该模型通过特征级别表征学习发现多行为转换模式的潜力,能够对多行为交互序列进行特征层次的深层表示,从而实现基于会话的推荐。对于会话兴趣动态问题上,Gu等提出了一种将项目图嵌入和上下文建模结合到推荐任务中的方法。它是基于所有历史会话序列构造的有向图,利用图神经网络捕捉项目之间丰富的局部依赖关系。并采用会话级注意机制,根据目标用户的当前兴趣获得每个好友的表示。它还对目标用户的历史会话兴趣应用最大池,了解其长期兴趣的动态性。基于会话推荐的技术上,Huang等提出了一个具有多级转换动力学(multi-level transition dynamics,MTD)的多任务学习框架,该框架能够以自动和分层的方式联合学习会话内和会话间的项目转换动力学,从而捕捉了复杂的过渡动态信息,这种过渡动态表现为时序和多级相互依赖的关系结构。

这六种分类方法是从问题角度出发的分类。如表2 所示,在这六大分类中不难发现,信息质量与数量是一个很大的影响因素,为了得到更多的有用信息,会采用隐式信息或者高阶信息。序列推荐方面也可以适量结合该方面的其他信息来提升推荐准确性。而跨域推荐中模型改进上的简化也值得探究。那么数据是否也需要简化呢?随着个性化和用户多行为化,个性化推荐和多样化推荐的平衡如何维持?这也有待研究。

表2 问题相似性归纳分析Table 2 Inductive analysis of problem similarity

4 GNN 推荐系统研究难点及未来研究方向

随着在线信息的爆炸式增长,人们提出了众多推荐方法,推荐系统取得了一定的研究进展。尤其是图神经网络,已有的研究进展和现今计算内存和速度的提升为图数据分析铺平了道路,对基于图神经网络的推荐系统研究提供了强有力的帮助。图神经网络作为一种有效的图数据深度表示学习技术,其研究已经成功地探索了推荐系统方面的多种任务,并证明了其有效性。以往图神经网络对推荐的研究角度是GNN 模型的图结构、个人或群体等,大多集中在无向图的结构或用户数量分类上,忽略了GNN 本身模型分类和问题本身。本文由方法、问题两个角度对图神经网络推荐系统进行了研究、分析,对比了方法中每小类的优点和局限性,概括了问题中的难点。以下是一些存在研究难点的未来研究方向。

4.1 数据稀疏性和冷启动

推荐系统应用中,用户行为数据稀少与用户或者项目的数量不足导致推荐系统长期存在稀疏性和冷启动问题,跨领域推荐方法及辅助信息的嵌入等方法应运而生。而对于图神经网络方面,随着知识表示学习和知识路径推理等关键知识图技术的出现,利用知识图谱辅助推荐将面临诸多挑战,也是一个重要的研究热点。文献[79]提出了协同知识增强的推荐方法,通过构建的交互图中项目之间的联系和知识图中实体之间的连通性来学习用户和项目的表示。除了将知识图谱与推荐系统结合起来,现实世界中还有许多其他外部结构信息可以帮助推荐,例如社交网络中的社会关系信息等。Guo等就提出了一种基于异构多关系图融合的信任推荐方法。它同时考虑用户的社会信任关系和项目相关知识,这为解决数据稀疏性和冷启动问题提供了更多的可能。特别是图卷积网络,其与其他方法的结合使得这一研究方向得到了进一步的发展。但是,单独运用图生成网络和图时空网络在推荐系统上比较少,最近这方面的研究渐渐多起来了,这将是未来尤其注意的方向,而图生成网络推荐系统方面的独立节点和其数据稀疏性导致模型易过拟合问题将是研究的重难点。

4.2 用户动态兴趣

知识图谱不仅包含各种数据类型(例如,像用户和项目这样的节点类型,以及像不同的行为类型这样的边类型),通常还有不同的和不确定的兴趣。在多行为用户和个性化推荐上,许多文献对用户动态兴趣问题提供了一些模型以及方法。Isufi等发展了一个从最近邻和最远邻图学习联合卷积表示的模型,以建立一个新的准确性-多样性权衡推荐系统。但大多数都是基于用户数据的补充上,如何解决与用户意图相关的嵌入问题,如何自适应地为每个用户设置不同的兴趣数,如何为多向量表示设计一个有效的传播模式等,需要进一步研究。因此,如何表现用户的多重和不确定的兴趣是一个值得探索的方向。

4.3 动态图与异构图

在现实世界的推荐系统中,不仅用户兴趣是动态的,而且用户和项目之间的关系也随着时间的推移而发生变化。为了确保推荐的精确度,系统需要时常更新信息。从图的角度来看,不断更新的信息带来的是动态图而不是静态图。而动态图形则带来了变化的结构。在实际应用中,如何针对动态图设计相应的GNN 框架是一个有趣的前瞻性研究课题。现有的推荐研究很少关注动态图,而且基于时空图神经网络的研究也很少,动态图在推荐中是一个很大程度上未被探索的领域,值得进一步研究。在推荐系统处理复杂、属性丰富、基于上下文的交互信息的性能上,现有的基于GCN 的方法大多集中于同构图环境下的任务求解,没有考虑异构图环境。传统的GCN 方法需要一个完整的图邻接矩阵来进行嵌入学习,这种为图中的每个节点生成邻居节点的递归方法使得训练一个深度大的GCNN 模型更具挑战性。由于处理复杂的计算和训练大规模数据集,再加上模型边界的过度测量,这在很大程度上阻碍了推荐系统框架的应用,还需要进行深入的研究。

4.4 大数据与数据噪音

在推荐系统中,随着时间累计,数据越来越多,数据量过大将会带来更多的数据噪音。目前的主要挑战是从用户-物品交互以及辅助信息中学习有用的信息。而处理复杂的计算和训练大规模数据集也是一个挑战。现有的基于图神经网络的方法利用用户与项目之间的高阶连通性来获得满意的性能,但是这些方法的训练效率较低,容易引入信息传播的偏差。此外,由于观测的交互信息极其稀疏,应用的贝叶斯个性化排序损失不足以为训练提供监督信号。为了解决上述问题,Pan等提出了有效图协同过滤方法。但不同的领域包含各种不同的图数据,节点和连边关系也各有不同,如何结合领域中有用的知识对给定的图数据利用图卷积神经网络进行建模是图卷积神经网络应用的关键问题。如果数据全部运用上,随之而来的是过平滑问题,而且推荐的准确度会降低。因此,如何在基于GNN 的推荐中为每个用户或项目自适应地选择合适的接收信息的范围也是一个值得研究的问题。数据作为推荐系统最重要的部分,如何解决推荐的多样性和个性化的问题。这也将是未来研究的主要问题。

总而言之,在现有研究的基础上,GNN 推荐系统的难点大致上与数据、动态问题有关。从数据量来看,存在由于数据过少而导致的数据稀疏性和冷启动问题,也存在数据过多时的数据筛选和数据噪音问题。从动态性来看,存在着用户的动态兴趣嵌入问题和动态、异构图的模型构建问题。这些难点也是未来研究的方向。

猜你喜欢
卷积神经网络节点
基于递归模糊神经网络的风电平滑控制策略
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于图连通支配集的子图匹配优化算法
一种并行不对称空洞卷积模块①
概念格的一种并行构造算法
结合概率路由的机会网络自私节点检测算法
采用贪婪启发式的异构WSNs 部分覆盖算法*
神经网络抑制无线通信干扰探究
从滤波器理解卷积
基于神经网络的中小学生情感分析