DSE精选文章
基于社会关系时空表示学习的个性化POI推荐
Spatio-Temporal Representation Learning with Social Tie for Personalized POI Recommendation
文章介绍
对于基于位置的社交网络(LBSN),推荐用户下一步将访问的一些兴趣点(POI)对用户和POI拥有者来说都变得越来越重要。最近的研究表明,嵌入技术有效地结合了兴趣点上下文信息以缓解数据稀疏性问题,循环神经网络(RNN)也已广泛地应用于序列预测。然而,仅使用单独的嵌入学习或单独的序列建模都会导致兴趣点推荐方法在捕捉用户个性化偏好方面受到限制。本文定义了连续POI推荐问题:给定用户的签到记录和他们的社交关系,根据查询用户u和他或她当前所处的地理位置和时间信息⟨u, v, t⟩, 本文的目标是推荐用户u在下一个时间段内可能感兴趣的前k个POI。为此,本文提出了一种联合嵌入和序列建模的时空神经网络模型PPR,该模型利用用户的签到记录和社交关系,来为查询用户推荐个性化的POI。此外,本文通过联合学习节点表示和建模用户个性化顺序偏好,将模型PPR扩展到一个端到端结合图神经网络的推荐模型GCN-LSTM。
模型方法

图1. 兴趣点推荐模型的框架图
实验效果
本文采用了3个真实世界大规模签到数据集进行评估,即Foursquare, Gowalla和Brightkite。表1显示了数据集的详细统计信息。
表1. 数据集特征

本文对比评估了所提出的模型PPR、GCN-LSTM与其他五个基准模型Rank-GeoFM、ST-RNN、GE、PEU-RNN、SAE-NAD在三个真实世界数据集上的整体性能。本文对每个数据集上的所有方法重复运行10次,并展示了四个评估指标Acc@k,Pre@k,Rec@k和NDCG@k的平均值,用粗体显示其中表现最好的两个模型。
表2展示了七个模型在Foursquare数据集上的性能比较,从表2中,我们观察到,就Foursquare数据集上的四个评估指标而言,PPR显著高于所有的基准模型。具体而言,PPR在Acc@5指标上达到了0.3008,在Acc@10指标上达到了0.3935,分别比第二好的基准模型Rank-GeoFM和SAD-NAE提高了22.5%和22.2%。
表2. 在Foursquare数据集上的性能比较

表3展示了七个模型在Gowalla数据集上的性能比较。如表3所示,PPR在以下四个指标也显著超过了所有其他模型:Acc@k,Pre@k,Rec@k和NDCG@k。特别是,PPR的性能表现比第二好的模型在Acc@k指标上要好14.6%和在NDCG@k指标上则要好9.2%。PPR与PEU-RNN相比,在Rec@10指标上表现稍差。这种现象可以解释为PEU-RNN使用了距离约束,这可能会使随着k的增加显著减少潜在的POI。
表3. 在Gowalla数据集上的性能比较

表4展示了各模型在Brightkite数据集上的性能比较,如表4所示,就Brightkite数据集的所有评估指标而言,PPR始终显著优于所有对比模型。PPR实现了最优的性能,例如在Acc@5上达到了0.8717、在Rec@5上达到了0.8485。更具体地说,与最先进的基于RNN的方法PEU-RNN相比,本文的PPR分别在以下指标实现了约21.3%、24.4%、22.2%和22.4%的提升:Acc@5, Pre@5, Rec@5和NDCG@5。此外,所有方法在Brightkite数据集上的性能都优于其他数据集。这是因为Brightkite的用户平均比Foursquare和Gowalla的用户有更多的签到记录,这可能使所有方法都能更准确地模拟用户的行为和偏好。
表4. 在Brightkite数据集的性能比较

图2展示了模型不同变体的性能比较。本文将模型PPR与四种精心设计的变体进行了比较,即PPR-RL、PPR-Seq、PPR-Den和PPR-GRU,以探究不同模块对于该模型性能的影响。基于图2,可以得到如下结果:1. PPR在大多数情况下在三个数据集上表现最好,这表明PPR模型能够较好的建模各种上下文因素。2. 不同上下文因素对推荐性能提升的贡献不同。3. 移除社会关系会降低PPR模型的性能,但并不显著,这意味着该模型没有严重依赖社会关系。4. 与其他变量相比,PPR和PPR-GRU表现出良好的性能,这表明序列模式和用户的动态化个性化偏好在基于位置的推荐系统中起着重要的作用。

图2. 模型不同变体的性能比较
图3、图4展示了本文模型(即PPR和GCN-LSTM)相对于三个对比模型(即Rank-GeoFM、PEU-RNN和SAE-NAD)对重要参数的敏感性度的影响,包括嵌入维度d、推荐的POI数目k和下一个时间段τ. 如图所示,PPR和GCN-LSTM与三个对比模型相比,随着嵌入维度d数量的增加,性能逐渐提升,当d达到128或更高时,GCN-LSTM模型基本保持稳定。同时,当d=128时,PPR达到最佳结果,然后随着d的进一步增加,PPR性能开始下降。而随着k的增加,PPR和GCN-LSTM有着更高的性能提升。随着τ的增加,本文的模型也始终优于其他三个模型。

图3. 在Foursquare上的参数灵敏度

图4. 在Gowalla上的参数灵敏度
本文通过将参数ρ从0变为600来评估参数ρ对PPR的影响。结果见表5,PPR在Foursquare、Gowalla和Brightkite数据集上,当ρ=300, ρ= 400和 ρ=100时分别实现了其最佳性能。与Foursquare和Gowalla相比,在Brightkite数据集上PPR实现最佳性能时的ρ较小。主要原因可能在于,Brightkite的用户平均比Foursquare和Gowalla的用户有更密集的签到记录。
表5. 参数ρ对PPR的影响

图5展示了超参数α对本文模型GCN-LSTM在推荐性能上的影响,如图,GCN-LSTM的Acc@5首先增加到最大值,然后随着α的增加逐渐减少。这是因为,表征学习目标函数和顺序建模目标函数在POI推荐中都发挥着重要作用。

图5. 超参数α对GCN-LSTM的影响
结语
作者简介
期刊简介

扫描二维码获取
更多精彩
CCF数据库专委









