基于图协同过滤增益的推荐系统研究

2023-03-02 03:17宋召豪陈亚军

太原师范学院学报(自然科学版) 2023年4期

关键词：增益神经网络协同

宋召豪,陈亚军*,万伟

(西华师范大学计算机学院,四川南充 637009)

0 引言

本文首次以协同过滤思想为基础,利用图滤波器操作发挥相似节点对目标节点的增益效果,很大程度上缓解了用户-项目二部图所具有的稀疏性.

1 相关工作

1.1 协同过滤

用户集表示为U,项目集表示为I,用户和项目的数量表示为N=|U|+|I|.在协同过滤中,评级矩阵为R∈|U|×|I|,其中如果用户i和项目j具有交互,则rij=1.考虑到用户、项目和评级矩阵R,协同过滤方法旨在学习得分函数s(u,i,R),以对未来用户可能感兴趣的候选项目进行排名.对于基于神经网络的协同过滤,通常将使用用户和项目的可学习嵌入表,并用E(0)∈N×d表示.

为了利用基于图的方法进行协同过滤,通常需要基于R的用户-项目二部图的邻接矩阵:

(1)

式中A∈N×N.为了确保训练的稳定性,大多数方法采用归一化邻接矩阵式中D是对角矩阵,表示节点i的程度.每个用户和每个项目都进一步分配了与其唯一ID对应的可学习嵌入和然后,基于图神经网络的方法将通过相邻节点上的传播来合并高阶信息,通常每一层的表示被连接为最终的节点表示[4].例如,代表性方法LightGCN[5]的传播可以表述为:式中k表示第k层图神经网络,最终的节点嵌入是通过不同层中嵌入的加权平均值获得:平滑的嵌入表E可以进一步用于计算不同用户-项目交互的推荐分数.

1.2 谱图神经网络

2 基于图协同过滤增益的推荐系统模型

2.1 模型结构

GCFG模型主要包含了嵌入初始化、基于Jacobi多项式的相似信息过滤、基于注意力的节点表示动态自适应融合和评分预测四个部分.单层GCFG模型结构如图1所示.

图1 单层GCFG模型结构

2.2 嵌入初始化

在GCFG模型中,初始化的过程是通过Xavier均匀初始化来完成的.Xavier均匀初始化是一种常用的权重初始化方法,用于避免神经网络训练过程中的梯度消失和梯度爆炸问题.

乡村的监测预警设备配置按照“七个一”标准建设，即：每个乡镇有1个自动监测站，每座小（1）型以上水库有1个自动水位雨量站，每座有防洪任务的小（2）型水库有 1个自动水位雨量站，每个村有1个简易雨量站和手摇报警器，每个山洪易发溪河两岸的村有1个简易水位站，每个村有1套预警广播和1个避灾点。另外，2012年福建省利用山洪灾害防治县级非工程措施项目契机，在全省所有自然村全面配置了6.8万面防汛预警铜锣，并建立锣长制，专人鸣锣。

2.3 基于Jacobi多项式的相似信息过滤

为了解决传统GNN方法只强调低频信号,没有明显抑制中频信号,同时不对高频分量产生负响应的局限性以及没有充分利用节点的相似信息等问题,考虑使用一种近似图信号滤波器的替代方法.这种方法可以通过寻找一组正交的多项式基函数来实现,在保证收敛性的同时,在节点的表示中考虑相似性信息,提供足够的表达能力以适应不同用户-项目图的滤波需求,其中Jacobi多项式是一种常见的选择[7].

低频和高频信号易于拟合,因此不使用任何激活函数,节点表示是通过对不同阶的嵌入进行平均来获得:

(2)

对于中频分量,典型的设计是αI-UgK(Λ)UT,α是控制中频信号影响的系数.带通滤波器的表示公式为:

(3)

最终的节点表示是它们的串联:

(4)

2.4 基于注意力的节点表示动态自适应融合

2.5 评分预测

3 实验与讨论

3.1 实验数据

实验数据选取Gowalla(99.92%数据稀疏性)数据集和Alibaba-iFashion(99.99%数据稀疏性)数据集.实验中,随机抽取每个用户的80%交互进行训练,10%的交互进行验证,剩余的 10% 交互用于测试.同时,为每个正实例采样一个负项以形成训练集.

3.2 评价指标

实验使用Recall@K和NDCG@K,这是协同过滤的两个广泛使用的指标来评估顶级推荐的性能.设置K值为10、20、50,以K=20为标准.更高的Recall@K和NDCG@K意味着更好的性能.取测试集中所有用户的平均值为评价指标.

3.3 实验结果与分析

实验数据集的批量大小设置为4096,嵌入大小设置为64.使用耐心为5个epoch的提前停止来防止过度拟合.对于GCFG,a和b在[-1.0,2.0]中进行了调整,步长为 0.5,学习率固定为0.001,λ固定为1e-6.实验基于24GB RTX 4090 GPU.

为了验证模型的有效性,与其他模型,如BPR、NGCF[9]、DGCF[10]、LightGCN、GTN[11]进行比较分析,在相同实验环境下,结果如表1所示.

表1 协同过滤方法实验对比结果

从表1可以看出,GCFG模型在更加稀疏的Alibaba-iFashion数据集上明显比在Gowalla数据集上的表现突出,这表明该模型更加擅长处理稀疏数据.在现实世界用户互动较少的客观情况下,该模型展现出了处理冷启动用户的能力.

在两个数据集上进行了消融实验以探究模型的有效性,结果如表2所示.

表2 GCFG模型消融实验

实验研究了GCFG的两种变体的性能:没有相似节点的增益作用(GCFG/-s);没有基于注意力机制的节点动态自适应融合(GCFG/-a).从表中可以看出两个组件都是有效的,缺乏任何组件的GCFG将具有性能退化.

4 结束语

本文依据协同过滤思想,将相似信息嵌入节点表示中,充分发挥相似节点对目标节点的增益作用,有效建模用户偏好和项目吸引力,缓解图的稀疏性问题.同时引入注意力机制,自适应地调整权重,动态融合不同节点表示.实验证明了模型的有效性和缓解冷启动问题的潜力.