论文题目: Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation

论文摘要:

最近关于推荐的研究主要集中在探索最先进的神经网络,以提高模型的表达能力,同时通常采用负抽样(NS)策略来提高学习效率。尽管有效,现有方法中有两个重要问题没有得到充分考虑:1) NS波动剧烈,基于抽样的方法在实际应用中难以获得最优的排序性能;2)尽管异构反馈(如查看、单击和购买)在许多在线系统中广泛存在,但大多数现有方法仅利用一种主要类型的用户反馈,如购买。在这项工作中,我们提出了一种新的非抽样转移学习解决方案,命名为高效异构协同过滤(EHCF),用于Top-N推荐。它不仅可以对细粒度的用户-项目关系进行建模,而且可以从整个异构数据(包括所有未标记的数据)中高效地学习模型参数,并且具有较低的时间复杂度。对三个真实数据集的大量实验表明,EHCF在传统(单一行为)和异构场景中都显著优于最先进的推荐方法。此外,EHCF在培训效率方面有显著的改进,使其更适用于真实世界的大型系统。我们的实现已经发布,以促进更有效的基于全数据的神经方法的进一步发展。

论文作者:

张敏博士是清华大学计算机科学与技术系的终身副教授,专门从事网络搜索和推荐以及用户建模。她是计算机系智能技术与系统实验室副主任,清华-MSRA媒体与搜索实验室执行主任。她还担任ACM信息系统事务(TOIS)的副编辑,SIGIR 2019教程主席,SIGIR 2018短论文主席,WSDM 2017项目主席等。发表论文100余篇,被引用次3500余次,H指数32分。2016年获北京市科技奖(一等奖),2018年获全国高校计算机科学优秀教师奖等。她还拥有12项专利,并与国内外企业进行了大量的合作。

马少平是清华大学智能技术与系统国家重点实验室计算机科学与技术系教授,研究领域为智能信息处理, 信息检索。主要研究兴趣是智能信息处理,主要集中在信息检索与Web信息挖掘等方面,尤其研究基于网络用户行为分析的语义挖掘,以改进搜索引擎的性能。

成为VIP会员查看完整内容
0
25

相关内容

马少平是清华大学智能技术与系统国家重点实验室计算机科学与技术系教授,研究领域为智能信息处理, 信息检索。主要研究兴趣是智能信息处理,主要集中在信息检索与Web信息挖掘等方面,尤其研究基于网络用户行为分析的语义挖掘,以改进搜索引擎的性能。

题目: Disentangled Graph Collaborative Filtering

简介: 从交互数据中学习用户和项目的信息表示对于协同过滤(CF)至关重要。当前的嵌入功能利用用户-项目关系来丰富表示,从单个用户-项目实例演变为整体交互图。然而,他们在很大程度上以统一的方式对关系进行建模,而忽略了用户采用这些项目的意图的多样性,这可能是为了消磨时间,出于兴趣或为家庭等其他人购物。这种对用户兴趣进行建模的统一方法很容易导致次优的表示形式,无法对各种关系进行建模,也无法使用户的意图分解开来。

在这项工作中,我们会以用户意图的更细粒度特别注意用户与项目之间的关系。因此,我们设计了一个新模型,即解缠图协同过滤(DGCF),以解开这些因素并产生解开的表示。具体来说,通过对每个用户项目交互的意图分布进行建模,我们可以迭代地细化意图感知交互图和表示形式。同时,我们鼓励不同意图的独立性。这导致了纠缠的表示,有效地提取了与每个意图有关的信息。我们在三个基准数据集上进行了广泛的实验,并且DGCF在一些最新模型(如NGCF [40],DisenGCN [25]和MacridVAE [26])上取得了显着改进。进一步的分析可以深入了解DGCF在消除用户意图和表示可解释性方面的优势。

成为VIP会员查看完整内容
0
4

正确处理丢失的数据是推荐中的一个基本挑战。目前的工作大多是对未观测数据进行负采样,为推荐模型的训练提供负信号。然而,现有的负采样策略,无论是静态的还是自适应的,都不足以产生高质量的负采样——既能提供模型训练的信息,又能反映用户的真实需求。在这项工作中,我们假设项目知识图谱(KG),它提供了丰富的项目和KG实体之间的关系,可以用来推断信息和事实的阴性样本。为此,我们提出了一种新的负采样模型——知识图谱策略网络(KGPolicy),它作为一种强化学习代理来探索高质量的负样本。具体来说,通过我们设计的探索操作,它从目标的正交互中导航,自适应地接收到知识感知的负信号,最终产生一个潜在的负项来训练推荐器。我们在一个配备了KGPolicy的矩阵分解(MF)模型上进行了测试,它在最先进的采样方法(如DNS和IRGAN)和kg增强的推荐模型(如KGAT)上都取得了显著的改进。进一步从不同的角度进行分析,为知识感知抽样提供了思路。我们通过这个https URL发布代码和数据集。

成为VIP会员查看完整内容
0
26

** 简介:**

推荐方法构造了预测模型,以估计用户与项目交互的可能性。先前的模型在很大程度上遵循一般的监督学习范式-将每个交互视为一个单独的数据实例,并基于“信息孤岛”进行预测。但是,此类方法忽略了数据实例之间的关系,这可能导致性能欠佳,尤其是对于稀疏场景。此外,建立在单独数据实例上的模型几乎无法显示出推荐背后的原因,从而使过程难以理解。

在本教程中,我们将从图学习的角度重新审视推荐问题。可以将用于推荐的通用数据源组织成图形,例如用户-项目交互(二分图),社交网络,项目知识图(异构图)等。这种基于图的组织将孤立的数据实例连接起来,从而为利用高阶连通性带来了好处,这些高阶连通性对有意义的模式进行了编码,以进行协作过滤,基于内容的过滤,社会影响力建模和知识感知推理。结合图神经网络(GNN)的最新成功,基于图的模型已展现出成为下一代推荐系统技术的潜力。本教程对基于图的学​​习方法进行了回顾,以提出建议,特别关注GNN的最新发展和知识图谱增强的建议。通过在本教程中介绍这个新兴而有前途的领域,我们希望观众可以对空间有深入的了解和准确的见解,激发更多的想法和讨论,并促进技术的发展。

目录:

作者简介:

王翔是新加坡国立大学(NUS)计算机学院的研究员。 他获得了博士学位。 他于2019年获得国大计算机科学博士学位。他的研究兴趣包括推荐系统,信息检索和数据挖掘。 在SIGIR,KDD,WWW和AAAI等顶级会议上,他拥有20多种出版物,包括TOIS和TKDE等期刊。 他曾担任CCIS 2019的本地主席,包括SIGIR,CIKM和MM在内的顶级会议的PC成员以及TKDE和TOIS等著名期刊的定期审稿人。

成为VIP会员查看完整内容
0
53

讲座题目

社会用户兴趣挖掘:方法与应用:Social User Interest Mining: Methods and Applications

讲座简介

社交网络上丰富的用户生成内容提供了建立模型的机会,这些模型能够准确有效地提取、挖掘和预测用户的兴趣,希望能够实现更有效的用户参与、更好质量地提供适当的服务和更高的用户满意度。虽然传统的建立用户档案的方法依赖于基于人工智能的偏好获取技术,这些技术可能被用户认为是侵入性的和不受欢迎的,但最近的进展集中在确定用户兴趣和偏好的非侵入性但准确的方法上。在本教程中,我们将介绍与有效挖掘用户兴趣相关的五个重要方面: 1)用于提取用户兴趣的信息源 2)文献中提出的各类用户兴趣简介 3)为挖掘用户利益而采用或提议的技术 4)最新方法的可扩展性和资源需求 5)文献中采用的评估方法,用于验证挖掘的用户兴趣概要的适当性。我们还将介绍现有的挑战、开放的研究问题和激动人心的工作机会。

讲座嘉宾

Fattane Zarrinkalam博士是Ryerson大学系统、软件和语义实验室(LS3)的博士后研究员,她在那里从事与支持语义的社交网络分析相关的项目。在博士研究期间,她专注于根据社交网络(尤其是Twitter)上的个人和集体行为来识别社交媒体用户的兴趣。她在CIKM、ESWC和ECIR等场馆发表了自己的作品。此外,她还在包括信息检索、信息处理和管理在内的顶级期刊上发表期刊论文。此外,在她攻读博士学位期间,她参与了两项向美国专利局提出的专利申请。

成为VIP会员查看完整内容
0
16

内容摘要: 个性化推荐在当前消费场景中起着至关重要的作用。本教程主要包括两个部分:基础和趋势。在第一部分中,我们将介绍个性化推荐系统的基本问题,包括用户意图和需求,挑战性问题和最新技术。在第二部分中,我们将重点关注相关领域中的新趋势主题,包括(但不限于):用户满意度和评估方式,可解释的推荐,基于知识图谱和推论的推荐,跨域异构推荐以及公平性。最后,我们将讨论未来的发展方向。

作者简介: 张敏博士是清华大学计算机科学与技术系的终身教授,研究方向为Web搜索和推荐以及用户建模。她是CS部门智能技术与系统实验室的副主任,清华-MSRA媒体与搜索实验室的执行主任。她还担任过ACM TOIS副编辑。她已发表了100多篇论文,引用次数超过3500, H-index得分为32。她在2016年获得了北京科学技术奖(一等奖),并在2018年获得了中国大学计算机科学优秀教师奖。她还拥有12项专利。并且她与国际和国内企业进行了很多合作。

成为VIP会员查看完整内容
0
40

题目:GNEG:Graph-Based Negative Sampling for word2vec

论文摘要; 负抽样是分布式词表示学习的一个重要组成部分。我们假设,考虑全局的语料库级信息,为每个目标词生成不同的噪声分布,比原始的基于频率的分布更能满足每个训练词的反例要求。为此,我们从语料库中预先计算单词的共现统计量,并将其应用于随机游走等it网络算法中。我们通过一系列实验验证了这一假设,实验结果表明,我们的方法将单词类比任务提高了约5%,并将单词相似性任务的性能提高了约1%。

成为VIP会员查看完整内容
0
16

教程题目: Foundations and Trends for Personalized Recommendation

摘要:

个性化推荐在当前的信息消费环境中起着至关重要的作用。本教程主要包括两个部分:基础和趋势。在第一部分中,我们将介绍个性化推荐系统的基本问题,包括用户意图和需求、挑战性问题和最新技术。在第二部分,我们将重点关注相关领域的新趋势话题,包括(但不限于):用户满意度与评价、可解释推荐、基于知识图谱和推理的推荐、跨域异构推荐、推荐系统中的公平性问题等。最后,将与与会者讨论未来的发展方向。

嘉宾介绍

张敏博士是清华大学计算机科学与技术系的终身副教授,专门从事网络搜索和推荐以及用户建模。她是计算机系智能技术与系统实验室副主任,清华-MSRA媒体与搜索实验室执行主任。她还担任ACM信息系统事务(TOIS)的副编辑,SIGIR 2019教程主席,SIGIR 2018短论文主席,WSDM 2017项目主席等。发表论文100余篇,被引用次3500余次,H指数32分。2016年获北京市科技奖(一等奖),2018年获全国高校计算机科学优秀教师奖等。她还拥有12项专利,并与国内外企业进行了大量的合作。

成为VIP会员查看完整内容
0
44

报告主题:Learning and Reasoning on Graph for Recommendation

报告摘要:推荐方法构造了预测模型,以估计用户与项目交互的可能性。先前的模型在很大程度上遵循一般的监督学习范例-将每个交互视为一个单独的数据实例,并基于“信息孤岛”进行预测。但是,此类方法忽略了数据实例之间的关系,这可能导致性能欠佳,尤其是对于稀疏场景。此外,建立在单独数据实例上的模型几乎不能显示出推荐背后的原因,从而使推荐过程难以理解。

在本教程中,我们将从图学习的角度重新审视推荐问题。可以将推荐的通用数据源组织成图形,例如用户-项目交互(二分图),社交网络,项目知识图(异构图)等。这种基于图的组织将孤立的数据实例连接起来,从而为利用高阶连通性带来了好处,这些高阶连通性对有意义的模式进行了编码,以进行协作过滤,基于内容的过滤,社会影响力建模和知识感知推理。结合图神经网络(GNN)的最新成功,基于图的模型已展现出成为下一代推荐系统技术的潜力。本教程提供了有关基于图的学​​习方法推荐的综述,特别着重于GNN的最新发展和知识图增强的推荐。通过在本教程中介绍这个新兴而有前途的领域,我们希望观众可以对空间有深入的了解和准确的见解,激发更多的想法和讨论,并促进技术的发展。

邀请嘉宾: 王翔,新加坡国立大学(NUS)计算机学院的研究员。 他获得了博士学位。 他于2019年获得国大计算机科学博士学位。他的研究兴趣包括推荐系统,信息检索和数据挖掘。 在SIGIR,KDD,WWW和AAAI等顶级会议上,他拥有20多种出版物,包括TOIS和TKDE等期刊。 他曾担任CCIS 2019的本地主席,包括SIGIR,CIKM和MM在内的顶级会议的PC成员以及TKDE和TOIS等著名期刊的定期审稿人。

何向南,中国科技大学(USTC)教授。他获得了博士学位。 2016年获得新加坡国立大学(NUS)计算机科学博士学位。他的研究兴趣涵盖信息检索,数据挖掘和应用机器学习。他在60多个顶级会议上发表了60多种出版物,这些会议包括SIGIR,WWW,KDD和MM,以及包括TKDE,TOIS和TNNLS在内的期刊。他在推荐器系统方面的工作在WWW 2018和SIGIR 2016上获得了最佳论文奖荣誉奖。此外,他还担任过CCIS 2019的PC主席,MM 2019和CIKM 2019的区域主席,并且是多个顶级会议的PC成员,包括SIGIR,WWW,KDD等,以及TKDE,TOIS,TMM等期刊的定期审阅者。他具有丰富的教学经验,包括在WWW 2018和SIGIR 2018中提供了“针对搜索和推荐匹配的深度学习”教程, SIGIR 2018中的教程“电子商务中的信息发现”,以及ICMR 2018中的教程“多媒体内容推荐技术”。

Tat-Seng Chua,是新加坡国立大学计算机学院的KITHCT讲座教授。他拥有博士学位。来自英国利兹大学。 1998年至2000年,他担任该学院的代理和创始院长。蔡博士的主要研究兴趣是多媒体信息检索和社交媒体分析。特别是,他的研究重点在于从网络和多个社交网络中提取和检索文本和富媒体(QA)。他是NExT的联合主任,NExT是NUS与清华大学之间的联合中心,致力于开发实时社交媒体搜索技术。蔡博士因其对多媒体计算,通信和应用的杰出技术贡献而荣获2015年ACM SIGMM大奖。他是ACM国际多媒体检索会议(ICMR)和多媒体建模(MMM)会议系列指导委员会主席。蔡博士还是ACM Multimedia 2005,ACM CIVR 2005,ACM SIGIR 2008和ACM Web Science 2015的联合主席。他在四家国际期刊的编辑委员会任职。蔡博士是新加坡两家技术初创公司的联合创始人。

成为VIP会员查看完整内容
CIKM2019-graph-for-recommendation.pdf
0
43

Learning vector representations (aka. embeddings) of users and items lies at the core of modern recommender systems. Ranging from early matrix factorization to recently emerged deep learning based methods, existing efforts typically obtain a user's (or an item's) embedding by mapping from pre-existing features that describe the user (or the item), such as ID and attributes. We argue that an inherent drawback of such methods is that, the collaborative signal, which is latent in user-item interactions, is not encoded in the embedding process. As such, the resultant embeddings may not be sufficient to capture the collaborative filtering effect. In this work, we propose to integrate the user-item interactions --- more specifically the bipartite graph structure --- into the embedding process. We develop a new recommendation framework Neural Graph Collaborative Filtering (NGCF), which exploits the user-item graph structure by propagating embeddings on it. This leads to the expressive modeling of high-order connectivity in user-item graph, effectively injecting the collaborative signal into the embedding process in an explicit manner. We conduct extensive experiments on three public benchmarks, demonstrating significant improvements over several state-of-the-art models like HOP-Rec and Collaborative Memory Network. Further analysis verifies the importance of embedding propagation for learning better user and item representations, justifying the rationality and effectiveness of NGCF. Codes are available at https://github.com/xiangwang1223/neural_graph_collaborative_filtering.

0
4
下载
预览

Recommender System (RS) is a hot area where artificial intelligence (AI) techniques can be effectively applied to improve performance. Since the well-known Netflix Challenge, collaborative filtering (CF) has become the most popular and effective recommendation method. Despite their success in CF, various AI techniques still have to face the data sparsity and cold start problems. Previous works tried to solve these two problems by utilizing auxiliary information, such as social connections among users and meta-data of items. However, they process different types of information separately, leading to information loss. In this work, we propose to utilize Heterogeneous Information Network (HIN), which is a natural and general representation of different types of data, to enhance CF-based recommending methods. HIN-based recommender systems face two problems: how to represent high-level semantics for recommendation and how to fuse the heterogeneous information to recommend. To address these problems, we propose to applying meta-graph to HIN-based RS and solve the information fusion problem with a "matrix factorization (MF) + factorization machine (FM)" framework. For the "MF" part, we obtain user-item similarity matrices from each meta-graph and adopt low-rank matrix approximation to get latent features for both users and items. For the "FM" part, we propose to apply FM with Group lasso (FMG) on the obtained features to simultaneously predict missing ratings and select useful meta-graphs. Experimental results on two large real-world datasets, i.e., Amazon and Yelp, show that our proposed approach is better than that of the state-of-the-art FM and other HIN-based recommending methods.

0
9
下载
预览
小贴士
相关VIP内容
清华大学张敏老师,个性化推荐的基础与趋势,145页ppt
专知会员服务
40+阅读 · 2019年11月27日
相关论文
Xiang Wang,Yaokun Xu,Xiangnan He,Yixin Cao,Meng Wang,Tat-Seng Chua
9+阅读 · 3月12日
Heterogeneous Graph Transformer
Ziniu Hu,Yuxiao Dong,Kuansan Wang,Yizhou Sun
8+阅读 · 3月3日
Xiang Wang,Xiangnan He,Meng Wang,Fuli Feng,Tat-Seng Chua
4+阅读 · 2019年5月20日
Chih-Ming Chen,Chuan-Ju Wang,Ming-Feng Tsai,Yi-Hsuan Yang
3+阅读 · 2019年2月19日
Joint Embedding of Meta-Path and Meta-Graph for Heterogeneous Information Networks
Lichao Sun,Lifang He,Zhipeng Huang,Bokai Cao,Congying Xia,Xiaokai Wei,Philip S. Yu
3+阅读 · 2018年9月11日
Kuan Liu,Xing Shi,Prem Natarajan
3+阅读 · 2018年5月28日
Qingyao Ai,Vahid Azizi,Xu Chen,Yongfeng Zhang
9+阅读 · 2018年5月9日
Guang-Neng Hu,Xin-Yu Dai,Feng-Yu Qiu,Rui Xia,Tao Li,Shu-Jian Huang,Jia-Jun Chen
5+阅读 · 2018年3月26日
Massimo Quadrana,Paolo Cremonesi,Dietmar Jannach
5+阅读 · 2018年2月23日
Huan Zhao,Quanming Yao,Yangqiu Song,James Kwok,Dik Lun Lee
9+阅读 · 2018年1月8日
Top