Graph neural networks (GNNs) have advanced recommender systems by modeling interaction relationships. However, existing graph-based recommenders rely on sparse ID features and do not fully exploit textual information, resulting in low information density within representations. Furthermore, graph contrastive learning faces challenges. Random negative sampling can introduce false negative samples, while fixed temperature coefficients cannot adapt to the heterogeneity of different nodes. In addition, current efforts to enhance recommendations with large language models (LLMs) have not fully utilized their Chain-of-Thought (CoT) reasoning capabilities to guide representation learning. To address these limitations, we introduces LGHRec (LLM-CoT Enhanced Graph Neural Recommendation with Harmonized Group Policy Optimization). This framework leverages the CoT reasoning ability of LLMs to generate semantic IDs, enriching reasoning processes and improving information density and semantic quality of representations. Moreover, we design a reinforcement learning algorithm, Harmonized Group Policy Optimization (HGPO), to optimize negative sampling strategies and temperature coefficients in contrastive learning. This approach enhances long-tail recommendation performance and ensures optimization consistency across different groups. Experimental results on three datasets demonstrate that LGHRec improves representation quality through semantic IDs generated by LLM's CoT reasoning and effectively boosts contrastive learning with HGPO. Our method outperforms several baseline models. The code is available at: https://anonymous.4open.science/r/LLM-Rec.


翻译:图神经网络(GNNs)通过建模交互关系推动了推荐系统的发展。然而,现有的基于图的推荐模型依赖于稀疏的ID特征,未能充分利用文本信息,导致表征内部信息密度较低。此外,图对比学习面临诸多挑战:随机负采样可能引入假负样本,而固定的温度系数无法适应不同节点的异质性。同时,当前利用大型语言模型(LLMs)增强推荐的研究尚未充分运用其思维链(CoT)推理能力来指导表征学习。为应对这些局限,本文提出了LGHRec(基于LLM-CoT增强的图神经网络推荐与协调组策略优化)。该框架利用LLMs的CoT推理能力生成语义ID,丰富推理过程,提升表征的信息密度与语义质量。此外,我们设计了一种强化学习算法——协调组策略优化(HGPO),用于优化对比学习中的负采样策略与温度系数。该方法增强了长尾推荐性能,并确保了不同组别间优化的一致性。在三个数据集上的实验结果表明,LGHRec通过LLM的CoT推理生成的语义ID提升了表征质量,并借助HGPO有效增强了对比学习效果。我们的方法在多个基线模型上表现优异。代码已发布于:https://anonymous.4open.science/r/LLM-Rec。

0
下载
关闭预览

相关内容

【KDD2024】面向鲁棒推荐的决策边界感知图对比学习
专知会员服务
21+阅读 · 2024年8月8日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
495+阅读 · 2023年3月31日
VIP会员
相关论文
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员