近期必读的6篇【图神经网络的推荐(GNN+R)】相关论文和代码(WWW、SIGIR、WSDM)

2019 年 5 月 7 日 专知
近期必读的6篇【图神经网络的推荐(GNN+R)】相关论文和代码(WWW、SIGIR、WSDM)

 【导读】最近小编推出CVPR2019图卷积网络CVPR2019生成对抗网络【可解释性】CVPR视觉目标跟踪CVPR视觉问答医学图像分割相关论文,反响热烈。最近,图神经网络很受欢迎,出现了各种结合图神经网络的应用,推荐系统也不例外,基于图神经网络的推荐文章近期出现WWW、SIGIR以及最近的KDD19上,建议研究推荐系统的童鞋抓紧跟上这一波,今年还有机会,加油!!!

今天小编专门整理最新六篇GNN+推荐相关应用论文—神经影响扩散、动态图注意力网络、归纳图模式、对偶图注意力网络、神经图协同滤波等。



1、A Neural Influence Diffusion Model for Social Recommendation(基于神经影响扩散模型的社交推荐)

SIGIR ’19 

作者Le Wu, Peijie Sun, Yanjie Fu, Richang Hong, Xiting Wang, Meng Wang

摘要精确的用户和商品表示学习是构建成功的推荐系统的关键。传统上,协同过滤(CF)提供了一种从用户-商品交互历史中学习用户和商品嵌入的方法。然而,由于用户行为数据的稀疏性,性能受到限制。随着在线社交网络的出现,社交推荐系统被提出利用每个用户的局部邻居偏好来缓解数据稀疏性,从而更好地进行用户嵌入建模。我们认为,对于每一个社交平台的用户,她潜在的嵌入是受她信任的用户影响的。随着社交影响在社交网络中递归传播和扩散,每个用户的兴趣在递归过程中发生变化。然而,目前的社交推荐模型只是利用每个用户的局部邻居来开发静态模型,没有模拟全局社交网络中的递归扩散,导致推荐性能不理想。在本文中,我们提出了一个深度影响传播模型来探究在社交推荐中用户如何受到递归的社交扩散过程的影响。对于每个用户,扩散过程开始于融合相关特征的初始嵌入和捕获潜在行为偏好的免费用户潜在向量。我们提出的模型的核心思想是,我们设计了一个分层的影响传播结构来模拟用户的潜在嵌入是如何随着社交扩散过程的继续而发展的。我们进一步证明,我们提出的模型是通用的,可以应用在用户~(商品)属性或社交网络结构不可用时。最后,在两个真实数据集上的大量实验结果清楚地显示了我们提出的模型的有效性,与最佳baseline相比,性能提高了13%以上。

网址

https://arxiv.org/abs/1904.10322v1


2、Session-based Social Recommendation via Dynamic Graph Attention Networks(基于会话的动态图注意力网络的社交推荐)

WSDM ’19 

作者Weiping Song, Zhiping Xiao, Yifan Wang, Laurent Charlin, Ming Zhang, Jian Tang

摘要Facebook和Twitter等在线社区非常受欢迎,已经成为许多用户日常生活的重要组成部分。通过这些平台,用户可以发现并创建其他人随后将使用的信息。在这种情况下,向用户推荐相关信息对于可行性至关重要。然而,在线社区推荐是一个具有挑战性的问题: 1)用户的兴趣是动态的,2)用户受朋友的影响。此外,影响者可能与上下文有关。也就是说,不同的朋友可以谈论不同的话题。因此,对这两种信号进行建模对于推荐非常重要。我们提出了一种基于动态图注意力神经网络的在线社区推荐系统。利用循环神经网络建立动态用户行为模型,利用图注意力神经网络建立情境相关的社交影响模型,根据用户当前的兴趣动态推断影响者。整个模型能够有效地拟合大规模数据。在多个真实世界数据集的实验结果证明了我们提出的方法在几个竞争baseline(包括最先进的模型)上的有效性。

网址

https://arxiv.org/abs/1902.09362v2

代码链接:

https://github.com/DeepGraphLearning/RecommenderSystems/tree/master/socialRec


3、Inductive Graph Pattern Learning for Recommender Systems Based on a Graph Neural Network(基于图神经网络归纳图模式学习的推荐系统)

作者Muhan Zhang, Yixin Chen

摘要大多数现代成功的推荐系统基于矩阵分解技术,即,从给定的评级矩阵中学习每个用户和每个商品的潜在嵌入,并使用嵌入来完成矩阵。然而,这些学习到的潜在嵌入本质上是可转换的,并不是为了推广到不可见的用户/商品或新任务。本文研究了一种基于用户-商品对局部图模式的推荐系统归纳模型。归纳模型可以推广到不可见的用户/商品,并可能迁移到其他任务。为了学习这种模型,我们为每个训练(用户、商品)对提取一个局部封闭子图,并将子图提供给图神经网络(GNN)来训练一个评级预测模型。结果表明,我们的模型使用最先进的转换方法实现了极具竞争力的性能,并且当评级矩阵稀疏时更稳定。此外,我们的迁移学习实验验证了学习到的模型可以转移到新任务。

https://arxiv.org/abs/1904.12058v1


4、Graph Neural Networks for Social Recommendation(基于图神经网络的社交推荐)

WWW'19

作者Wenqi Fan, Yao Ma, Qing Li, Yuan He, Eric Zhao, Jiliang Tang, Dawei Yin

摘要近年来,图神经网络(GNNs)能够很自然地将节点信息和拓扑结构结合起来,在学习图数据方面表现出了强大的功能。由于社交推荐系统中的数据可以表示为用户-用户社交图和用户-商品图,因此GNNs的这些优点为推进社交推荐提供了巨大的潜力;而学习用户和商品的潜在表示是关键。然而,构建基于GNNs的社交推荐系统面临着挑战。例如,用户-商品图既编码交互又编码它们的相关意见; 社交关系具有异质性优势;用户涉及两个图(例如用户-用户社交图和用户-商品图)。为了同时解决上述三个问题,本文提出了一种新的用于社交推荐的图神经网络框架(GraphRec)。特别地,我们提供了一种原则性的方法来联合捕获用户-商品图中的交互和意见,并提出了框架GraphRec,该框架连贯地对两个图和异构优势进行建模。在两个真实数据集上的大量实验证明了该框架GraphRec的有效性。

网址

https://arxiv.org/abs/1805.08403v3


5、Dual Graph Attention Networks for Deep Latent Representation of Multifaceted Social Effects in Recommender Systems(对偶图注意力网络,用于推荐系统中多方面社交效应的深度潜在表示

WWW'19 Oral

作者Qitian Wu, Hengrui Zhang, Xiaofeng Gao, Peng He, Paul Weng, Han Gao, Guihai Chen

摘要在传统的协同过滤方法中,社交推荐利用社交信息来解决数据稀疏性和冷启动问题。然而,大多数现有的模型都假设来自朋友用户的社交影响是静态的,并且是以恒定权重或固定约束的形式存在的。为了放松这一强假设,本文提出了对偶注意力网络来协作学习双重社交效应的表示,其中一个由用户特定的注意力权重建模,另一个由动态的、上下文感知的注意力权重建模。我们还将用户领域的社交效应扩展到商品领域,以便利用相关商品的信息进一步缓解数据稀疏问题。此外,考虑到两个领域中不同的社交效应可以相互作用,共同影响用户对物品的偏好,我们提出了一种policy-based的融合策略,该策略基于multi-armed bandit来衡量各种社交效应的交互作用。在一个benchmark数据集和一个商业数据集上的实验验证了模型中关键组件的有效性。结果表明,与其他最先进的社交推荐方法相比,我们的模型在推荐精度上有了很大的提高。

网址

https://arxiv.org/abs/1810.12241v1

代码链接:

https://github.com/arnab39/FewShot_GAN-Unet3D


6、Neural Graph Collaborative Filtering(神经图协同滤波)

SIGIR'19

作者Xiang Wang, Xiangnan He, Meng Wang

摘要学习向量表示(用户和商品的嵌入)是现代推荐系统的核心。从早期的矩阵分解到最近出现的基于深度学习的方法,现有的工作通常通过从描述用户(或商品)的现有特征(如ID和属性)映射来获得用户(或商品)的嵌入。我们认为,这种方法的一个固有缺点是,隐藏在用户-商品交互中的协作信号没有在嵌入过程中编码。因此,由此产生的嵌入可能不足以捕获协作过滤效果。在这项工作中,我们建议将用户-商品交互—更具体地说是二分图结构—集成到嵌入过程中。我们提出了一个新的推荐框架Neural Graph Collaborative Filtering(NGCF),它利用用户-商品图结构,在其上传播嵌入。这就导致了用户-商品图中高阶连通性的表达建模,有效地将协作信号显式地注入到嵌入过程中。我们在三个公共benchmark上进行了广泛的实验,证明了对几种最先进的模型(如HOPRec[42]和Collaborative Memory Network [5])的显著改进。进一步的分析验证了嵌入传播对于学习更好的用户和商品表示的重要性,证明了NGCF的合理性和有效性。

网址

https://github.com/xiangwang1223/neural_graph_collaborative_filtering

代码链接:

https://github.com/xiangwang1223/neural_graph_collaborative_filtering


请关注专知公众号(点击上方蓝色专知关注

  • 后台回复“GNNR2019” 就可以获取《六篇论文的下载链接~ 


-END-

专 · 知

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!

欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询!

请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成!530+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程

登录查看更多
180

相关内容

图神经网络 (GNN) 是一种连接模型,它通过图的节点之间的消息传递来捕捉图的依赖关系。与标准神经网络不同的是,图神经网络保留了一种状态,可以表示来自其邻域的具有任意深度的信息。近年来,图神经网络(GNN)在社交网络、知识图、推荐系统、问答系统甚至生命科学等各个领域得到了越来越广泛的应用。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【导读】作为世界数据挖掘领域的最高级别的学术会议,ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)每年都会吸引全球领域众多专业人士参与。今年的 KDD大会计划将于 2020 年 8 月 23 日 ~27 日在美国美国加利福尼亚州圣地亚哥举行。上周,KDD 2020官方发布接收论文,共有1279篇论文提交到Research Track,共216篇被接收,接收率16.8%。近期KDD官网公布了接受论文列表,为此,上个月专知小编为大家整理了图神经网络相关的论文,这期小编继续为大家奉上KDD 2020必读的五篇图神经网络(GNN)相关论文-Part 2——多层次GCN、无监督预训练GCN、图Hash、GCN主题模型、采样

KDD 2020 Accepted Paper: https://www.kdd.org/kdd2020/accepted-papers

KDD2020GNN_Part1、CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、

1. Multi-level Graph Convolutional Networks for Cross-platform Anchor Link Prediction

作者:Hongxu Chen, Hongzhi Yin, Xiangguo Sun, Tong Chen, Bogdan Gabrys, Katarzyna Musial

摘要:跨平台的账号匹配在社交网络分析中发挥着重要作用,并且有利于广泛的应用。然而,现有的方法要么严重依赖于高质量的用户生成内容(包括用户兴趣模型),要么只关注网络拓扑结构,存在数据不足的问题,这使得研究这个方向变得很困难。为了解决这一问题,我们提出了一种新的框架,该框架统一考虑了局部网络结构和超图结构上的多级图卷积。该方法克服了现有工作中数据不足的问题,并且不一定依赖于用户的人口统计信息。此外,为了使所提出的方法能够处理大规模社交网络,我们提出了一种两阶段的空间协调机制,在基于网络分区的并行训练和跨不同社交网络的帐户匹配中对齐嵌入空间。我们在两个大规模的真实社交网络上进行了广泛的实验。实验结果表明,该方法的性能比现有的模型有较大幅度的提高。

网址:

https://arxiv.org/abs/2006.01963

2. GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training

作者:Jiezhong Qiu, Qibin Chen, Yuxiao Dong, Jing Zhang, Hongxia Yang, Ming Ding, Kuansan Wang, Jie Tang

摘要:图表示学习已经成为解决现实问题的一种强有力的技术。包括节点分类、相似性搜索、图分类和链接预测在内的各种下游图学习任务都受益于它的最新发展。然而,关于图表示学习的现有技术集中于领域特定的问题,并为每个图训练专用模型,这通常不可转移到领域之外的数据。受自然语言处理和计算机视觉在预训练方面的最新进展的启发,我们设计了图对比编码(Graph Contrastive Coding,GCC)一个无监督的图表示学习框架来捕捉跨多个网络的通用网络拓扑属性。我们将GCC的预训练任务设计为网络内部和网络之间的子图级别的实例判断,并利用对比学习来增强模型学习内在的和可迁移的结构表征能力。我们在三个图学习任务和十个图数据集上进行了广泛的实验。结果表明,GCC在一组不同的数据集上进行预训练,可以获得与从头开始的特定任务训练的方法相媲美或更好的性能。这表明,预训练和微调范式对图表示学习具有巨大的潜力。

网址:

https://arxiv.org/abs/2006.09963

代码链接:

https://github.com/THUDM/GCC

3. GHashing: Semantic Graph Hashing for Approximate Similarity Search in Graph Databases

作者:Zongyue Qin, Yunsheng Bai, Yizhou Sun

摘要:图相似搜索的目的是根据给定的邻近度,即图编辑距离(GED),在图形数据库中找到与查询最相似的图。这是一个被广泛研究但仍具有挑战性的问题。大多数研究都是基于剪枝验证框架,该框架首先对非看好的图进行剪枝,然后在较小的候选集上进行验证。现有的方法能够管理具有数千或数万个图的数据库,但由于其精确的剪枝策略,无法扩展到更大的数据库。受到最近基于深度学习的语义哈希(semantic hashing)在图像和文档检索中的成功应用的启发,我们提出了一种新的基于图神经网络(GNN)的语义哈希,即GHash,用于近似剪枝。我们首先用真实的GED结果训练GNN,以便它学习生成嵌入和哈希码,以保持图之间的GED。然后建立哈希索引以实现恒定时间内的图查找。在回答一个查询时,我们使用哈希码和连续嵌入作为两级剪枝来检索最有希望的候选对象,并将这些候选对象发送到精确的求解器进行最终验证。由于我们的图哈希技术利用了近似剪枝策略,与现有方法相比,我们的方法在保持高召回率的同时,实现了显著更快的查询时间。实验表明,该方法的平均速度是目前唯一适用于百万级数据库的基线算法的20倍,这表明GHash算法成功地为解决大规模图形数据库的图搜索问题提供了新的方向。

网址:

http://web.cs.ucla.edu/~yzsun/papers/2020_KDD_GHashing.pdf

4. Graph Structural-topic Neural Network

作者:Qingqing Long, Yilun Jin, Guojie Song, Yi Li, Wei Lin

摘要:图卷积网络(GCNS)通过有效地收集节点的局部特征,取得了巨大的成功。然而,GCNS通常更多地关注节点特征,而较少关注邻域内的图结构,特别是高阶结构模式。然而,这种局部结构模式被显示为许多领域中的节点属性。此外,由于网络很复杂,每个节点的邻域由各种节点和结构模式的混合组成,不只是单个模式,所有这些模式上的分布都很重要。相应地,在本文中,我们提出了图结构主题神经网络,简称GraphSTONE,这是一种利用图的主题模型的GCN模型,使得结构主题广泛地从概率的角度捕捉指示性的图结构,而不仅仅是几个结构。具体地说,我们使用 anonymous walks和Graph Anchor LDA(一种LDA的变体,首先选择重要的结构模式)在图上建立主题模型,以降低复杂性并高效地生成结构主题。此外,我们设计了多视图GCNS来统一节点特征和结构主题特征,并利用结构主题来指导聚合。我们通过定量和定性实验对我们的模型进行了评估,我们的模型表现出良好的性能、高效率和清晰的可解释性。

网址:

https://arxiv.org/abs/2006.14278

代码链接:

https://github.com/YimiAChack/GraphSTONE/

5. Minimal Variance Sampling with Provable Guarantees for Fast Training of Graph Neural Networks

作者:Weilin Cong, Rana Forsati, Mahmut Kandemir, Mehrdad Mahdavi

摘要:抽样方法(如节点抽样、分层抽样或子图抽样)已成为加速大规模图神经网络(GNNs)训练不可缺少的策略。然而,现有的抽样方法大多基于图的结构信息,忽略了最优化的动态性,导致随机梯度估计的方差较大。高方差问题在非常大的图中可能非常明显,它会导致收敛速度慢和泛化能力差。本文从理论上分析了抽样方法的方差,指出由于经验风险的复合结构,任何抽样方法的方差都可以分解为前向阶段的嵌入近似方差和后向阶段的随机梯度方差,这两种方差都必须减小,才能获得较快的收敛速度。我们提出了一种解耦的方差减小策略,利用(近似)梯度信息自适应地对方差最小的节点进行采样,并显式地减小了嵌入近似引入的方差。理论和实验表明,与现有方法相比,该方法即使在小批量情况下也具有更快的收敛速度和更好的泛化能力。

网址:

https://arxiv.org/abs/2006.13866

成为VIP会员查看完整内容
0
106

【导读】作为CCF推荐的A类国际学术会议,International ACM SIGIR Conference on Research and Development in Information Retrieval(国际计算机学会信息检索大会,简称 SIGIR)在信息检索领域享有很高的学术声誉,每年都会吸引全球众多专业人士参与。今年的 SIGIR 2020计划将于 2020年7月25日~30日在中国西安举行。本次大会共有555篇长文投稿,仅有147篇长文被录用,录用率约26%。专知小编提前为大家整理了六篇SIGIR 2020 基于图神经网络的推荐(GNN+RS)相关论文,这六篇论文分别出自中科大何向南老师和和昆士兰大学阴红志老师团队,供大家参考——捆绑推荐、Disentangled GCF、服装推荐、多行为推荐、全局属性GNN

CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN

1. Bundle Recommendation with Graph Convolutional Networks

作者:Jianxin Chang, Chen Gao, Xiangnan He, Yong Li, Depeng Jin

摘要:捆绑推荐(Bundle recommendation )旨在推荐一组商品供用户整体消费。现有的解决方案通过共享模型参数或多任务学习的方式将用户项目交互建模集成到捆绑推荐中,然而,这些方法不能显式建模项目与捆绑包(bundles)之间的隶属关系,不能探索用户选择捆绑包时的决策。在这项工作中,我们提出了一个用于捆绑推荐的图神经网络模型BGCN(Bundle Graph Convolutional Network)。BGCN将用户-项目交互、用户-捆绑包交互和捆绑包-项目从属关系统一到一个异构图中。以项目节点为桥梁,在用户节点和捆绑包节点之间进行图卷积传播,使学习到的表示能够捕捉到项目级的语义。通过基于hard-negative采样器的训练,可以进一步区分用户对相似捆绑包的细粒度偏好。在两个真实数据集上的实验结果表明,BGCN的性能有很高的提升,其性能比最新的基线高出10.77%到23.18%。

网址: https://arxiv.org/abs/2005.03475

2. Disentangled Graph Collaborative Filtering

作者:Xiang Wang, Hongye Jin, An Zhang, Xiangnan He, Tong Xu, Tat-Seng Chua

摘要:从交互数据中学习用户和项目的信息表示对于协同过滤(CF)至关重要。当前的嵌入函数利用用户-项目关系来丰富表示,从单个用户-项目实例演变为整体交互图。然而,这些方法在很大程度上以统一的方式对关系进行建模,而忽略了用户采用这些项目的意图的多样性,这可能是为了打发时间,为了兴趣,或者为其他人(如家庭)购物。这种统一的对用户兴趣建模的方法很容易导致次优表示,不能对不同的关系建模并在表示中分清用户意图。在这项工作中,我们特别关注用户意图细粒度上的用户-项目关系。因此,我们设计了一种新的模型- Disentangled图协同过滤(Disentangled Graph Collaborative Filtering ,DGCF),来理清这些因素并产生disentangled的表示。具体地说,通过在每个用户-项目交互意图上的分布建模,我们迭代地细化意图感知的交互图和表示。同时,我们鼓励不同的意图独立。这将生成disentangled的表示,有效地提取与每个意图相关的信息。我们在三个基准数据集上进行了广泛的实验,DGCF与NGCF、DisenGCN和MacridV AE这几个最先进的模型相比取得了显著的改进。进一步的分析揭示了DGCF在分解用户意图和表示的可解释性方面的优势。

网址:

http://staff.ustc.edu.cn/~hexn/

代码链接:

https://github.com/xiangwang1223/disentangled_graph_collaborative_filtering.

3. GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection

作者:Shijie Zhang, Hongzhi Yin, Tong Chen, Quoc Viet Nguyen Hung, Zi Huang, Lizhen Cui

摘要:近年来,推荐系统已经成为所有电子商务平台中不可缺少的功能。推荐系统的审查评级数据通常来自开放平台,这可能会吸引一群恶意用户故意插入虚假反馈,试图使推荐系统偏向于他们。此类攻击的存在可能会违反高质量数据始终可用的建模假设,而这些数据确实会影响用户的兴趣和偏好。因此,构建一个即使在攻击下也能产生稳定推荐的健壮推荐系统具有重要的现实意义。本文提出了一种基于GCN的用户表示学习框架GraphRf,该框架能够统一地进行稳健的推荐和欺诈者检测。在其端到端学习过程中,用户在欺诈者检测模块中被识别为欺诈者的概率自动确定该用户的评级数据在推荐模块中的贡献;而在推荐模块中输出的预测误差作为欺诈者检测模块中的重要特征。因此,这两个组成部分可以相互促进。经过大量的实验,实验结果表明我们的GraphRf在鲁棒评级预测和欺诈者检测这两个任务中具有优势。此外,所提出的GraphRf被验证为对现有推荐系统上的各种攻击具有更强的鲁棒性。

网址:

https://arxiv.org/abs/2005.10150

4. Hierarchical Fashion Graph Network for Personalized Outfit Recommendation

作者:Xingchen Li, Xiang Wang, Xiangnan He, Long Chen, Jun Xiao, Tat-Seng Chua

摘要:服装推荐越来越受到网购服务商和时尚界的关注。与向用户推荐单个单品(例如,朋友或图片)的其他场景(例如,社交网络或内容共享)不同,服装推荐预测用户对一组匹配良好的时尚单品的偏好。因此,进行高质量的个性化服装推荐应满足两个要求:1)时尚单品的良好兼容性;2)与用户偏好的一致性。然而,目前的研究主要集中在其中一个需求上,只考虑了用户-全套服装(outfit)或全套服装-项目的关系,从而容易导致次优表示,限制了性能。在这项工作中,我们统一了两个任务,服装兼容性建模和个性化服装推荐。为此,我们开发了一个新的框架,层次时尚图网络(HFGN),用于同时建模用户、商品和成套服装之间的关系。特别地,我们构建了一个基于用户-全套服装交互和全套服装-项目映射的层次结构。然后,我们从最近的图神经网络中得到启发,在这种层次图上使用嵌入传播,从而将项目信息聚合到一个服装表示中,然后通过他/她的历史服装来提炼用户的表示。此外,我们还对这两个任务进行了联合训练,以优化这些表示。为了证明HFGN的有效性,我们在一个基准数据集上进行了广泛的实验,HFGN在NGNN和FHN等最先进的兼容性匹配模型基础上取得了显著的改进。

网址:

https://arxiv.org/abs/2005.12566

代码链接:

https://github.com/xcppy/hierarchical_fashion_graph_network

5. Multi-behavior Recommendation with Graph Convolutional Networks

作者:Bowen Jin, Chen Gao, Xiangnan He, Depeng Jin, Yong Li

摘要:传统的推荐模型通常只使用一种类型的用户-项目交互,面临着严重的数据稀疏或冷启动问题。利用多种类型的用户-项目交互(例如:点击和收藏)的多行为推荐可以作为一种有效的解决方案。早期的多行为推荐研究未能捕捉到行为对目标行为的不同程度的影响。它们也忽略了多行为数据中隐含的行为语义。这两个限制都使得数据不能被充分利用来提高对目标行为的推荐性能。在这项工作中,我们创新性地构造了一个统一的图来表示多行为数据,并提出了一种新的模型--多行为图卷积网络(Multi-Behavior Graph Convolutional Network,MBGCN)。MBGCN通过用户-项目传播层学习行为强度,通过项目-项目传播层捕获行为语义,较好地解决了现有工作的局限性。在两个真实数据集上的实验结果验证了该模型在挖掘多行为数据方面的有效性。我们的模型在两个数据集上的性能分别比最优基线高25.02%和6.51%。对冷启动用户的进一步研究证实了该模型的实用性。

网址:

http://staff.ustc.edu.cn/~hexn/

6. GAG: Global Atributed Graph Neural Network for Streaming Session-based Recommendation

作者:Ruihong Qiu, Hongzhi Yin, Zi Huang, Tong Chen

摘要:基于流会话的推荐(Streaming session-based recommendation,SSR)是一项具有挑战性的任务,它要求推荐器系统在流媒体场景(streaming scenario)中进行基于会话的推荐(SR)。在电子商务和社交媒体的现实应用中,在一定时间内产生的一系列用户-项目交互被分组为一个会话,这些会话以流的形式连续到达。最近的SR研究大多集中在静态集合上,即首先获取训练数据,然后使用该集合来训练基于会话的推荐器模型。他们需要对整个数据集进行几个epoch的训练,这在流式设置下是不可行的。此外,由于对用户信息的忽视或简单使用,它们很难很好地捕捉到用户的长期兴趣。虽然最近已经提出了一些流推荐策略,但它们是针对个人交互流而不是会话流而设计的。本文提出了一种求解SSR问题的带有Wasserstein 库的全局属性图(GAG)神经网络模型。一方面,当新的会话到达时,基于当前会话及其关联用户构造具有全局属性的会话图。因此,GAG可以同时考虑全局属性和当前会话,以了解会话和用户的更全面的表示,从而在推荐中产生更好的性能。另一方面,为了适应流会话场景,提出了Wasserstein库来帮助保存历史数据的代表性草图。在两个真实数据集上进行了扩展实验,验证了GAG模型与最新方法相比的优越性。

网址: https://sites.google.com/site/dbhongzhi/

成为VIP会员查看完整内容
0
109

【导读】国际万维网大会(The Web Conference,简称WWW会议)是由国际万维网会议委员会发起主办的国际顶级学术会议,创办于1994年,每年举办一届,是CCF-A类会议。WWW 2020将于2020年4月20日至4月24日在中国台湾台北举行。本届会议共收到了1129篇长文投稿,录用217篇长文,录用率为19.2%。近期,推荐相关也比较热门,专知小编提前整理了WWW 2020 推荐系统比较有意思的的论文,供参考——序列推荐、可解释Serendipity 推荐、推荐效率、 bandit推荐、Off-policy学习。 WWW2020RS_Part1

  1. A Contextualized Temporal Attention Mechanism for Sequential Recommendation

作者:Jibang Wu, Renqin Cai, Hongning Wang

摘要:根据用户的历史连续行为预测用户的偏好对于现代推荐系统来说是具有挑战性的,也是至关重要的。现有的序列推荐算法在建模历史事件对当前预测的影响时,大多侧重于序列行为之间的过渡结构,而很大程度上忽略了时间和上下文信息。在这篇文章中,我们认为过去的事件对用户当前行为的影响应该随着时间的推移和不同的背景而变化。因此,我们提出了一种情境时间注意力机制(Contextualized Temporal Attention),该机制可以学习权衡历史行为在行为以及行为发生的时间和方式上的影响。更具体地说,为了动态地校准来自自注意力机制的相对输入的依赖关系,我们提出了多个参数化的核函数以学习各种时间动态,然后使用上下文信息来确定每个输入要跟随哪一个kernel( reweighing kernels )。在对两个大型公开推荐数据集进行的实证评估中,我们的模型始终优于一系列最先进的序列推荐方法。

网址:

https://arxiv.org/pdf/2002.00741.pdf

  1. Directional and Explainable Serendipity Recommendation

作者:Xueqi Li, Wenjun Jiang, Weiguang Chen, Jie Wu, Guojun Wang, Kenli Li

摘要:近几年来,Serendipity推荐越来越受到人们的关注,它致力于提供既能迎合用户需求,又能开阔他们眼界的建议。然而,现有的方法通常使用标量而不是向量来度量用户与项目的相关性,忽略了用户的偏好方向,这增加了不相关推荐的风险。此外,合理的解释增加了用户的信任度和接受度,但目前没有为Serendipity推荐提供解释的工作。为了解决这些局限性,我们提出了一种有向的、可解释的Serendipity推荐方法,称为DESR。具体而言,首先采用基于高斯混合模型(GMM)的无监督方法提取用户的长期偏好,然后利用胶囊(capsule )网络捕捉用户的短期需求。然后,我们提出了将长期偏好与短期需求相结合的意外(serendipity)向量,并利用它生成有向的Serendipity推荐。最后,利用反向路径选择方案进行了解释。在真实数据集上的大量实验表明,与现有的基于意外(serendipity)发现的方法相比,DESR能够有效地提高意外性和可解释性,促进多样性。

网址 https://cis.temple.edu/~jiewu/research/publications/Publication_files/jiang_www_2020.pdf

  1. LightRec: a Memory and Search-Efficient Recommender System

作者:Defu Lian, Haoyu Wang, Zheng Liu, Jianxun Lian, Enhong Chen, Xing Xie

摘要:近年来,深度推荐系统已经取得了显着的进步。尽管具有出色的排名精度,但实际上运行效率和内存消耗在现实中却是严重的瓶颈。为了克服这两个瓶颈,我们提出了LightRec,这是一个轻量级的推荐系统,具有快速的在线推断功能和经济的内存消耗。LightRec的主干是总共B个codebooks,每个codebook均由W个潜在向量组成,称为codewords。在这种结构的顶部,LightRec将有一个商品表示为B codewords的加法组合,这些B codewords是从每个codebook中选择的最佳的。为了有效地从数据中学习codebooks,我们设计了一个端到端的学习工作流程,其中所提出的技术克服了固有差异性和多样性方面的挑战。另外,为了进一步提高表示质量,采用了几种distillation策略,可以更好地保留用户-商品的相关性得分和相对排名顺序。我们对LightRec在四个真实数据集上进行了广泛评估,得出了两个经验发现:1)与最先进的轻量级baseline相比,LightRec在召回性能方面取得了超过11%的相对改进;2)与传统推荐算法相比,在top-k推荐算法中,LightRec的精度下降幅度可以忽略不计,但速度提高了27倍以上。

网址: http://staff.ustc.edu.cn/~liandefu/paper/lightrec.pdf

  1. Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

作者:Mengyue Yang, Qingyang Li, Zhiwei Qin, Jieping Ye

摘要:上下文多臂 bandit(MAB)在各种问题上实现了优异性能。然而,当涉及到推荐系统和在线广告等现实场景时,必须考虑探索的资源消耗。在实践中,通常存在与在环境中执行建议(ARM)相关联的非零成本,因此,应该在固定的探索成本约束下学习策略。由于直接学习全局最优策略是一个NP难题,并且极大地使bandit算法的探索和开发之间的权衡复杂化,因此直接学习全局最优策略是一个很大的挑战。现有的方法着重于通过采用贪婪策略来解决问题,该策略估计预期的收益和成本,并基于每个臂的预期收益/成本比使用贪婪的选择,利用历史观察直到勘探资源耗尽为止。然而,现有的方法当没有更多的资源时,学习过程就会终止,因此很难扩展到无限的时间范围。本文提出了一种分层自适应上下文bandit方法(HATCH)来进行有预算约束的上下文bandit的策略学习。HATCH采用一种自适应的方法,根据剩余资源/时间和对不同用户上下文之间报酬分配的估计来分配勘探资源。此外,我们利用充分的上下文特征信息来找到最好的个性化推荐。最后,为了证明提出的理论,我们进行了regret bound分析,并证明HATCH的regret bound低至O(√T)。实验结果证明了该方法在合成数据集和实际应用中的有效性和效率。

网址: https://arxiv.org/pdf/2004.01136.pdf

  1. Off-policy Learning in Two-stage Recommender Systems

作者:Jiaqi Ma, Zhe Zhao, Xinyang Yi, Ji Yang, Minmin Chen, Jiaxi Tang, Lichan Hong, Ed H. Chi

摘要:许多现实世界中的推荐系统需要高度可伸缩性:将数百万个项目与数十亿用户进行匹配,并只具有毫秒级的延迟。可伸缩性的要求导致了广泛使用的两阶段推荐系统,由第一阶段高效的候选生成模型和第二阶段更强大的排序模型组成。通常使用记录的用户反馈(例如,用户点击或停留时间)来构建用于推荐系统的候选生成和排名模型。虽然很容易收集大量这样的数据,但因为反馈只能在以前系统推荐的项目上观察到,因此这些数据在本质上是有偏见的。近年来,推荐系统研究领域对此类偏差的off-policy 修正引起了越来越多的关注。然而,现有的大多数工作要么假设推荐系统是一个单阶段系统,要么只研究如何将离策略校正应用于系统的候选生成阶段,而没有显式地考虑这两个阶段之间的相互作用。在这项工作中,我们提出了一种两阶段离策略(two-stage off-policy)策略梯度方法,并证明了在两阶段推荐系统中忽略这两个阶段之间的交互会导致次优策略。该方法在训练候选生成模型时明确考虑了排序模型,有助于提高整个系统的性能。我们在具有大项目空间的真实数据集上进行了实验,验证了所提方法的有效性。

网址: http://www.jiaqima.com/papers/OP2S.pdf

成为VIP会员查看完整内容
0
61

【导读】国际万维网大会(The Web Conference,简称WWW会议)是由国际万维网会议委员会发起主办的国际顶级学术会议,创办于1994年,每年举办一届,是CCF-A类会议。WWW 2020将于2020年4月20日至4月24日在中国台湾台北举行。本届会议共收到了1129篇长文投稿,录用217篇长文,录用率为19.2%。近期,随着会议的临近,有很多paper放出来,几周前专知小编整理了WWW 2020图神经网络(GNN)比较有意思的论文,这期小编继续为大家奉上WWW 2020五篇GNN相关论文供参考——对抗攻击、Heterogeneous Graph Transformer、图生成、多关系GNN、知识库补全。

WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN

  1. Adversarial Attack on Community Detection by Hiding Individuals

作者:Jia Li, Honglei Zhang, Zhichao Han, Yu Rong, Hong Cheng and Junzhou Huang

摘要:已经证明,添加了不可察觉扰动的对抗图(adversarial graphs),会导致深层图模型在节点/图分类任务中失败。在本文中,我们将对抗性图扩展到困难得多的社区发现(community detection)问题上。我们关注黑盒攻击,致力于隐藏目标个体,使其不被深度图社区检测模型检测到,该模型在现实场景中有很多应用,例如,保护社交网络中的个人隐私,理解交易网络中的伪装模式。我们提出了一个迭代学习框架,轮流更新两个模块:一个作为约束图生成器,另一个作为替代社区发现模型。我们还发现,我们的方法生成的对抗图可以迁移到其他基于社区发现模型的学习中。

网址:https://arxiv.org/abs/2001.07933

  1. Heterogeneous Graph Transformer

作者:Ziniu Hu, Yuxiao Dong, Kuansan Wang and Yizhou Sun

摘要:近年来,图神经网络(GNNs)在结构化数据建模方面取得了突飞猛进的成功。然而,大多数GNN都是为同质图(所有的节点和边都属于相同的类型)设计的,这使得这些GNN不能表示异构结构。在这篇文章中,我们提出了异构图转换器(HGT)结构来建模Web规模的异构图。为了建模异构性,我们设计了与节点和边类型相关的参数来表征对每条边的异构关注,使得HGT能够维护不同类型的节点和边的专有表示。为了处理动态异构图,我们将相对时间编码技术引入到HGT中,能够捕获任意持续时间的动态结构依赖关系。为了处理Web规模的图数据,我们设计了异构小批量图采样算法HGSamples,以实现高效和可扩展的训练。在具有1.79亿个节点和20亿条边的开放学术图上的广泛实验表明,本文所提出的HGT模型在各种下游任务上的性能一致地比所有最新的GNN基线高出9%-21%。

网址:https://arxiv.org/abs/2003.01332

代码链接:https://github.com/acbull/pyHGT

  1. GraphGen: A Scalable Approach to Domain-agnostic Labeled Graph Generation

作者:Nikhil Goyal, Harsh Vardhan Jain and Sayan Ranu

摘要:图生成模型在数据挖掘领域中得到了广泛的研究。传统的技术基于预定义分布的生成结构,而最近的技术已转向直接从数据中学习此分布。虽然基于学习的方法在质量上有了显著的提高,但仍有一些缺点需要解决。首先,学习图的分布会带来额外的计算开销,这就限制了这些方法对大型图数据库的可扩展性。第二,许多方法只学图结构,并没有学习节点和边的标签(这些标签编码重要的语义信息会影响结构自身)。第三,现有技术往往包含领域的特定规则,缺乏通用性。第四,现有方法的实验部分要么使用了较弱的评估指标,要么主要集中在合成数据或小数据集上,实验不够全面上。在这项工作中,我们提出了一种称为GraphGen的域未知(domain-agnostic)技术来克服所有这些缺点,GraphGen使用最少的DFS代码将图转换为序列。最小DFS码是规范化的标签,并且可以精确地捕捉图结构和标签信息。本文通过一种新的LSTM结构学习结构标签和语义标签之间复杂的联合分布。在百万级的真实图数据集上的广泛实验表明,GraphGen的平均速度是最先进方法的4倍,同时在11个不同指标的综合集合中质量明显更好。

网址:https://arxiv.org/abs/2001.08184

代码链接:

https://github.com/idea-iitd/graphgen

  1. Beyond Clicks: Modeling Multi-Relational Item Graph for Session-Based Target Behavior Prediction

作者:Wen Wang, Wei Zhang, Shukai Liu, Bo Zhang, Leyu Lin and Hongyuan Zha

摘要:基于会话的目标行为预测旨在预测要与特定行为类型(例如,点击)交互的下一项。虽然现有的基于会话的行为预测方法利用强大的表示学习方法来编码项目在低维空间中的顺序相关性,但是它们受到一些限制。首先,之前的方法侧重于只利用同一类型的用户行为进行预测,而忽略了将其他行为数据作为辅助信息的潜力。当目标行为稀疏但很重要(例如,购买或共享物品)时,辅助信息尤为重要。其次,项目到项目的关系是在一个行为序列中单独和局部建模的,缺乏一种规定的方法来更有效地全局编码这些关系。为了克服这些局限性,我们提出了一种新的基于会话的多关系图神经网络模型(MGNN-SPred)。具体地说,我们基于来自所有会话的所有行为序列(涉及目标行为类型和辅助行为类型)构建多关系项目图(Multi-Relational Item Graph,MRIG)。在MRIG的基础上,MGNN-SPred学习全局项目与项目之间的关系,进而获得用户偏好分别作为为当前目标行为序列和辅助行为序列。最后,MGNN-SPred利用门控机制自适应地融合用户表示,以预测与目标行为交互的下一项。在两个真实数据集上的广泛实验证明了MGNN-SPred与最新的基于会话的预测方法相比的优越性,验证了利用辅助行为和基于MRIG学习项目到项目关系的优点。

网址:https://arxiv.org/abs/2002.07993

  1. Open Knowledge Enrichment for Long-tail Entities

作者:Ermei Cao, Difeng Wang, Jiacheng Huang and Wei Hu

摘要:知识库(KBS)已经逐渐成为许多人工智能应用的宝贵资产。虽然目前的许多知识库相当大,但它们被是不完整的,特别是缺乏长尾实体(例如:不太有名的人)。现有的方法主要通过补全缺失连接或补齐缺失值来丰富知识库。然而,它们只解决了充实知识库问题的一部分,缺乏对长尾实体的具体考虑。在这篇文章中,我们提出了一种新颖的知识补齐方法,它从开放的Web中预测缺失的属性并推断出长尾实体的真实值。利用来自流行实体的先验知识来改进每个充实步骤。我们在合成数据集和真实数据集上的实验以及与相关工作的比较表明了该方法的可行性和优越性。

网址:https://arxiv.org/abs/2002.06397

成为VIP会员查看完整内容
0
61

【导读】最近小编推出CVPR2019图卷积网络相关论文和CVPR2019生成对抗网络相关视觉论文,反响热烈。最近,模型的可解释性是现在正火热的科研和工程问题,也在各个顶级会议上都有相关文章发表,今天小编专门整理最新十篇可解释性相关应用论文—推荐系统、知识图谱、迁移学习以及视觉推理等。

1、Recurrent Knowledge Graph Embedding for Effective Recommendation(基于循环知识图嵌入的推荐)

RecSys ’18

作者:Zhu Sun, Jie Yang, Jie Zhang, Alessandro Bozzon, Long-Kai Huang, Chi Xu

摘要:知识图(KGs)已被证明是改进推荐的有效方法。现有的方法主要依赖于KG手工设计的特性(例如,元路径meta paths),这需要领域知识(domain knowledge)。本文介绍了一种KG嵌入方法RKGE,它可以自动学习实体和实体之间的路径的语义表示,从而描述用户对商品的偏好。具体地说,RKGE采用了一种新的循环网络架构,其中包含了一批循环网络,用于对链接相同实体对的路径进行语义建模,这些路径无缝地融合到推荐中。它还使用pooling操作符来区分不同路径在描述用户对商品的偏好时的显著性。对真实数据集的广泛验证显示出RKGE相对于最先进方法的优越性。此外,我们证明了RKGE为推荐结果提供了有意义的解释。

网址:

https://yangjiera.github.io/works/recsys2018.pdf

2、Explainable Recommendation via Multi-Task Learning in Opinionated Text Data( 在观点文本数据中基于多任务学习的可解释性推荐)

SIGIR ’18

作者:Nan Wang, Hongning Wang, Yiling Jia, Yue Yin

摘要:通过解释自动生成的推荐,可以让用户更明智、更准确地决定使用哪些结果,从而提高他们的满意度。在这项工作中,我们开发了一个可解释推荐的多任务学习解决方案。通过联合张量因子分解,将推荐用户偏好建模和解释用户意见内容建模这两项学习任务结合起来。因此,该算法不仅预测了用户对一组商品的偏好,即推荐,而且预测用户如何在特征级别上喜欢某一特定商品,即观点文本解释。通过对Amazon和Yelp两个大型评论数据集的大量实验,与现有的几种推荐算法相比,验证了我们的解决方案在推荐和解释任务方面的有效性。我们广泛的实验研究清楚地证明了我们的算法生成的可解释建议有着不错的实用价值。

网址:

https://arxiv.org/abs/1806.03568

代码链接:

https://github.com/MyTHWN/MTER

3、TEM:Tree-enhanced Embedding Model for Explainable Recommendation(基于Tree增强嵌入方法的可解释性推荐)

WWW ’18

作者:Xiang Wang, Xiangnan He, Fuli Feng, Liqiang Nie, Tat-Seng Chua

摘要:虽然协同过滤是个性化推荐的主导技术,但它只对用户-商品交互进行建模,不能为推荐提供具体的理由。与此同时,与用户-商品交互相关的丰富的侧面信息(例如,用户统计数据和商品属性)提供了有价值的证据,可以说明为什么该推荐适合于用户,但在提供解释方面还没有得到充分的探索。在技术方面,基于嵌入的方法,如广度&深度和神经因子分解机,提供了最先进的推荐性能。然而,它们的工作原理就像一个黑匣子,无法明确地呈现出预测背后的原因。另一方面,决策树等基于树的方法通过从数据中推断决策规则来进行预测。虽然可以解释,但它们不能推广到不可见的特性交互,因此在协作过滤应用程序中会失败。在这项工作中,我们提出了一种新的解决方案,称为树增强嵌入方法,它结合了基于嵌入和基于树的模型的优点。我们首先使用一个基于树的模型从丰富的侧面信息来学习明确的决策规则(又称交叉特征)。接下来,我们设计了一个嵌入模型,该模型可以包含显式交叉特征,并推广到用户ID和商品ID上不可见的交叉特征。嵌入方法的核心是一个易于解释的注意力网络,使得推荐过程完全透明和可解释。我们对旅游景点和餐厅推荐的两个数据集进行了实验,证明了我们的解决方案的优越性能和可解释性。

网址:

https://dl.acm.org/citation.cfm?id=3178876.3186066

代码链接:

https://github.com/xiangwang1223/TEM

4、Explainable Reasoning over Knowledge Graphs for Recommendation(基于知识图谱可解释推理的推荐)

AAAI ’19

作者:Xiang Wang, Dingxian Wang, Canran Xu, Xiangnan He, Yixin Cao, Tat-Seng Chua

摘要:近年来,将知识图谱与推荐系统相结合引起越来越多的关注。通过研究知识图谱中的相互关系,可以发现用户与商品之间的连接路径,这为用户与商品之间的交互提供了丰富且互补的信息。这种连通性不仅揭示了实体和关系的语义,而且有助于理解用户的兴趣。然而,现有的工作尚未充分探索用来推断用户偏好的这种连接性,特别是在建模路径内部的顺序依赖关系和整体语义方面。本文提出了一种新的知识感知路径递归网络(Knowledgeaware Path Recurrent Network,KPRN)模型,利用知识图进行推荐。KPRN可以通过组合实体和关系的语义来生成路径表示。通过利用路径中的顺序依赖关系,我们允许对路径进行有效的推理,从而推断用户-商品交互的基本原理。此外,我们设计了一个新的加权pooling操作来区分连接用户和商品的不同路径的优势,使我们的模型具有一定的可解释性。我们对电影和音乐的两个数据集进行了大量的实验,证明了,与最好的方法相比,CKE(Collaborative Knowledge Base Embedding)和神经因子分解(Neural Factorization Machine),都有了显著的改进。

网址:

https://arxiv.org/abs/1811.04540

代码链接:

https://github.com/eBay/KPRN

5、Explainable Recommendation Through Attentive Multi-View Learning(基于注意力机制多视角学习的可解释推荐)

AAAI ’19

作者:Jingyue Gao, Xiting Wang, Yasha Wang, Xing Xie

摘要:由于信息的爆炸式增长,推荐系统在我们的日常生活中发挥着越来越重要的作用。当我们评估一个推荐模型时,准确性和可解释性是两个核心方面,并且已经成为机器学习的基本权衡指标之一。在本文中,我们提出通过开发一个结合了基于深度学习的模型和现有可解释方法的优点的可解释的深度模型,来减轻准确性和可解释性之间的权衡。其基本思想是基于可解释的深度层次结构(如Microsoft概念图)构建初始网络,通过优化层次结构中的关键变量(如节点重要性和相关性)来提高模型精度。为了保证准确的评分预测,我们提出了一个周到的多视图学习框架。该框架通过在不同的特征层之间进行协同正则化,并专注地结合预测,使我们能够处理稀疏和噪声数据。为了从层次结构中挖掘可读的解释,我们将个性化解释生成问题定义为一个约束树节点选择问题,并提出了一种动态规划算法来解决该问题。实验结果表明,该模型在准确性和可解释性方面均优于现有的最好的方法。

网址:

https://www.microsoft.com/en-us/research/publication/explainable-recommendation-through-attentive-multi-view-learning/

6、ExFaKT- A Framework for Explaining Facts over Knowledge Graphs and Text(ExFaKT:一个基于知识图谱和文本来解释事实的框架)

WSDM ’19

作者:Mohamed H. Gad-Elrab, Daria Stepanova, Jacopo Urbani, Gerhard Weikum

摘要:事实检验是准确填充、更新和整理知识图谱的关键。手工验证候选事实非常耗时。先前关于自动完成这一任务的工作侧重于使用非人类可解释的数值分数来估计真实性。另一些则提取文本中对候选事实的显式提及作为候选事实的证据,这很难直接发现。在我们的工作中,我们引入了ExFaKT,这是一个专注于为候选事实生成人类可理解的解释的框架。ExFaKT使用以Horn子句形式编码的背景知识将相关事实重写为一组其他更容易找到的事实。我们框架的最终输出是文本和知识图谱中候选事实的一组语义跟踪。实验表明,我们的重写在保持较高精确度的同时,显著提高了事实发现的召回率。此外,我们还表明,这些解释有效地帮助人类执行事实检查,并且在用于自动事实检查时也可以执行得很好。

网址:

https://dl.acm.org/citation.cfm?id=3290996

代码链接:

https://www.dropbox.com/sh/wpyyiyy5lusph40/AAC72xbQoGhCu4Qpa-mwUvDua?dl=0

7、Interaction Embeddings for Prediction and Explanation in Knowledge Graphs(知识图谱中的预测和解释的交互嵌入学习)

WSDM ’19

作者:Wen Zhang, Bibek Paudel, Wei Zhang, Abraham Bernstein, Huajun Chen

摘要:知识图嵌入旨在学习实体和关系的分布式表示,并在许多应用中被证明是有效的。交叉交互(Crossover interactions)——实体和关系之间的双向影响——有助于在预测新的三元组时选择相关信息,但之前从未正式讨论过。在本文中,我们提出了一种新的知识图嵌入算法CrossE,它可以显式地模拟交叉交互。它不仅像以前的大多数方法一样,为每个实体和关系学习一个通用嵌入,而且还为这两个实体和关系生成多个三重特定嵌入,称为交互嵌入。我们评估了典型链接预测任务的嵌入,发现CrossE在复杂和更具挑战性的数据集上实现了最先进的结果。此外,我们从一个新的角度来评估嵌入——为预测的三元组提供解释,这对实际应用非常重要。在本工作中,对三元组的解释被认为是头尾实体之间可靠的闭合路径。与其他baseline相比,我们通过实验证明,CrossE更有能力生成可靠的解释来支持其预测,这得益于交互嵌入。

网址:

https://arxiv.org/abs/1903.04750

8、SimGNN- A Neural Network Approach to Fast Graph Similarity Computation(SimGNN:一种快速计算图相似度的神经网络方法)

WSDM ’19

作者:Yunsheng Bai, Hao Ding, Song Bian, Ting Chen, Yizhou Sun, Wei Wang

摘要:图相似度搜索是基于图的最重要的应用之一,例如查找与已知化合物最相似的化合物。图的相似度/距离计算,如图的编辑距离(GED)和最大公共子图(MCS),是图的相似度搜索和许多其他应用的核心操作,但在实践中计算成本很高。受最近神经网络方法在一些图应用(如节点或图分类)中的成功的启发,我们提出了一种新的基于神经网络的方法来解决这个经典但具有挑战性的图问题,目的是在保持良好性能的同时减轻计算负担。这个被称为SimGNN的方法结合了两种策略。首先,我们设计了一个可学习的嵌入函数,它将每个图映射到一个嵌入向量,该向量提供了一个图的全局摘要。提出了一种新的注意机制,针对特定的相似度度量强调重要节点。其次,设计了一种节点对比较法,用细粒度节点信息来补充图级嵌入。我们的模型对不可见图有较好的泛化效果,并且在最坏的情况下,对两个图中的节点数运行二次方的时间。以GED计算为例,在三个实际图形数据集上的实验结果表明了该方法的有效性和效率性。具体来说,我们的模型与一系列baseline相比,包括一些基于GED计算的近似算法和许多现有的基于图神经网络的模型,实现了更小的错误率和更大的时间缩短。我们的工作表明,SimGNN为图相似度计算和图相似度搜索提供了一个新的研究方向。

网址:

https://dl.acm.org/citation.cfm?id=3290967

代码链接:

https://github.com/benedekrozemberczki/SimGNN

9、Human-centric Transfer Learning Explanation via Knowledge Graph(通过知识图谱以人为中心的迁移学习可解释)

AAAI-19 Workshop on Network Interpretability for Deep Learning

作者:Gao Yuxia Geng, Jiaoyan Chen, Ernesto Jim´enez-Ruiz, Huajun Chen

摘要:迁移学习(Transfer Learning)是利用从一个问题(源域)中学习到的知识来解决另一个不同但相关的问题(目标域),已经引起了广泛的研究关注。然而,目前的迁移学习方法大多是无法解释的,尤其是对没有机器学习专业知识的人来说。在这篇摘要中,我们简要介绍了两种基于知识图谱(KG)的人类可理解迁移学习解释框架。第一个解释了卷积神经网络(CNN)学习特征通过预训练和微调从一个域到另一个域的可移植性,第二个证明了零样本学习(zero-shot learning ,ZSL)中多个源域模型预测的目标域模型的合理性。这两种方法都利用了KG及其推理能力,为迁移过程提供了丰富的、人类可以理解的解释。

网址:

https://arxiv.org/abs/1901.08547

10、Explainable and Explicit Visual Reasoning over Scene Graphs(对场景图进行的可解释和显式的视觉推理)

CVPR-19

作者:Jiaxin Shi, Hanwang Zhang, Juanzi Li

摘要:我们的目标是将复杂视觉推理任务中使用的流行黑盒神经架构拆分为可解释的,明确的神经模块(XNMs), 它能够超越现有的神经模块网络,使用场景图—对象作为节点,成对关系作为边—用于结构化知识的可解释和明确推理。XNMs让我们更加关注教机器如何“思考”,无论它们“看起来”是什么。正如我们将在本文中展示的那样,通过使用场景图作为一个归纳偏差,1)我们可以用简洁灵活的方式设计XNMs,即, XNMs仅由4种元类型组成,大大减少了10 ~ 100倍的参数数量,2)我们可以根据图的注意力程度显式地跟踪推理流程。XNMs是如此的通用,以至于它们支持具有不同质量的各种场景图实现。例如,当图形被完美地检测到时,XNMs在CLEVR和CLEVR CoGenT上的准确率都达到了100%,为视觉推理建立了一个经验性能上限; 当从真实世界的图像中噪声检测出这些图时,XNMs仍然很健壮,在VQAv2.0上达到了67.5%的有竞争力的精度,超越了流行的没有图结构的(bag-of-objects)注意力模型。

网址:

https://arxiv.org/abs/1812.01855

代码链接:

https://github.com/shijx12/XNM-Net

链接:https://pan.baidu.com/s/1ETMl1B0LvIND0kj4NqrUuQ 提取码:9e9x

成为VIP会员查看完整内容
0
43

最近小编推出CVPR2019图卷积网络、CVPR2019生成对抗网络、【可解释性】,CVPR视觉目标跟踪,CVPR视觉问答,医学图像分割,图神经网络的推荐,CVPR域自适应, ICML图神经网络,ICML元学习相关论文,反响热烈。最近,ACL 2019最新接受文章出炉,大会共收到2905 篇论文投稿,其中660 篇被接收(接收率为22.7%)。小编发现,今年接受的文章结合GNN的工作有二三十篇,看来,图神经网络已经攻占NLP领域,希望其他领域的同学多多学习,看能否结合,期待好的工作!今天小编专门整理最新十篇ACL长文,图神经网络(GNN)+NLP—注意力机制引导图神经网络、Graph-to-Sequence、动态融合图网络、实体和关系抽取、Multi-hop阅读理解、多模态上下文图理解等。

1、Attention Guided Graph Convolutional Networks for Relation Extraction (注意力机制引导图神经网络的关系抽取)

ACL ’19

作者:Zhijiang Guo*, Yan Zhang* and Wei Lu

摘要:Dependency trees传递丰富的结构信息,这些信息对于提取文本中实体之间的关系非常有用。然而,如何有效利用相关信息而忽略Dependency trees中的无关信息仍然是一个具有挑战性的研究问题。现有的方法使用基于规则的hard-pruning策略来选择相关的部分依赖结构,可能并不总是产生最佳结果。本文提出了一种直接以全依赖树为输入的Attention Guided图卷积网络(AGGCNs)模型。我们的模型可以理解为一种soft-pruning方法,它自动学习如何有选择地关注对关系提取任务有用的相关子结构。在包括跨句n元关系提取和大规模句级关系提取在内的各种任务上的大量结果表明,我们的模型能够更好地利用全依赖树的结构信息,其结果显著优于之前的方法。

网址: http://www.statnlp.org/paper/2019/attention-guided-graph-convolutional-networks-relation-extraction.html

代码链接:

https://github.com/Cartus/AGGCN_TACRED

2、Cognitive Graph for Multi-Hop Reading Comprehension at Scale(大规模认知图的Multi-Hop阅读理解)

ACL ’19

作者:Ming Ding, Chang Zhou, Qibin Chen, Hongxia Yang, Jie Tang

摘要:我们提出了一种新的基于CogQA的web级文档multi-hop问答框架。该框架以认知科学的对偶过程理论为基础,通过协调隐式抽取模块(System 1)和显式推理模块(System 2),在迭代过程中逐步构建认知图,在给出准确答案的同时,进一步提供了可解释的推理路径。具体来说,我们基于BERT和graph neural network (GNN)的实现有效地处理了HotpotQA fullwiki数据集中数百万个multi-hop推理问题的文档,在排行榜上获得了34.9的F1 score,而最佳竞争对手的得分为23.6。

网址: https://arxiv.org/abs/1905.05460

代码链接: https://github.com/THUDM/CogQA

3、Coherent Comment Generation for Chinese Articles with a Graph-to-Sequence Model(使用Graph-to-Sequence模型为中文文章生成连贯的评论)

ACL ’19

作者:Wei Li, Jingjing Xu, Yancheng He, Shengli Yan, Yunfang Wu, Xu sun

摘要:自动文章评论有助于鼓励用户参与和在线新闻平台上的互动。然而,对于传统的基于encoder-decoder的模型来说,新闻文档通常太长,这往往会导致一般性和不相关的评论。在本文中,我们提出使用一个Graph-to-Sequence的模型来生成评论,该模型将输入的新闻建模为一个主题交互图。通过将文章组织成图结构,我们的模型可以更好地理解文章的内部结构和主题之间的联系,这使得它能够更好地理解故事。我们从中国流行的在线新闻平台Tencent Kuaibao上收集并发布了一个大规模的新闻评论语料库。广泛的实验结果表明,与几个强大的baseline模型相比,我们的模型可以产生更多的连贯性和信息丰富性的评论。

网址: https://arxiv.org/abs/1906.01231

代码链接: https://github.com/lancopku/Graph-to-seq-comment-generation

4、Dynamically Fused Graph Network for Multi-hop Reasoning(基于动态融合图网络的Multi-hop Reasoning)

ACL ’19

作者:Yunxuan Xiao, Yanru Qu, Lin Qiu, Hao Zhou, Lei Li, Weinan Zhang, Yong Yu

摘要:近年来,基于文本的问答(TBQA)得到了广泛的研究。大多数现有的方法侧重于在一段话内找到问题的答案。然而,许多有难度的问题需要来自两个或多个文档的分散文本的支持证据。本文提出了动态融合图网络(Dynamically Fused Graph Network ,DFGN),这是一种解决需要多个分散证据和推理的问题的新方法。受人类逐步推理行为的启发,DFGN包含一个动态融合层,从给定查询中提到的实体开始,沿着文本动态构建的实体图进行探索,并逐步从给定文档中找到相关的支持实体。我们在需要multi-hop reasoning的公共TBQA数据集HotpotQA上评估了DFGN。DFGN在公共数据集上取得了有竞争力的成绩。此外,我们的分析表明,DFGN可以产生可解释的推理链。

网址: https://arxiv.org/abs/1905.06933

5、 Encoding Social Information with Graph Convolutional Networks for Political Perspective Detection in News Media(利用图卷积网络对Social Information进行编码,用于新闻媒体中的政治倾向性检测)

ACL ’19

作者:Chang Li, Dan Goldwasser

摘要:确定新闻事件在媒体中讨论方式的政治视角是一项重要而富有挑战性的任务。在这篇文章中,我们强调了将社交网络置于情景化的重要性,捕捉这些信息如何在社交网络中传播。我们使用最近提出的一种表示关系信息的神经网络结构——图卷积网络(Graph Convolutional Network)来捕获这些信息,并证明即使在很少的social information分类中也可以得到显著改进。

网址: https://www.cs.purdue.edu/homes/dgoldwas//downloads/papers/LiG_acl_2019.pdf

6、Graph Neural Networks with Generated Parameters for Relation Extraction(用于关系抽取的具有生成参数的图神经网络)

ACL ’19

作者:Hao Zhu, Yankai Lin, Zhiyuan Liu, Jie Fu, Tat-seng Chua, Maosong Sun

摘要:近年来,在改进机器学习领域的关系推理方面取得了一些进展。在现有的模型中,图神经网络(GNNs)是最有效的multi-hop关系推理方法之一。事实上,在关系抽取等自然语言处理任务中,multi-hop关系推理是必不可少的。本文提出了一种基于自然语言语句生成图神经网络(GP-GNNs)参数的方法,使神经网络能够对非结构化文本输入进行关系推理。我们验证了从文本中提取关系的GPGNN。 实验结果表明,与baseline相比,我们的模型取得了显著的改进。我们还进行了定性分析,证明我们的模型可以通过multi-hop关系推理发现更精确的关系。

网址: https://arxiv.org/abs/1902.00756

7、Incorporating Syntactic and Semantic Information in Word Embeddings using Graph Convolutional Networks(使用图卷积网络在词嵌入中结合句法和语义信息)

ACL ’19

作者:Shikhar Vashishth, Manik Bhandari, Prateek Yadav, Piyush Rai, Chiranjib Bhattacharyya, Partha Talukdar

摘要:词嵌入已被广泛应用于多种NLP应用程序中。现有的词嵌入方法大多利用词的sequential context来学习词的嵌入。虽然有一些尝试利用词的syntactic context,但这种方法会导致词表数的爆炸。在本文中,我们通过提出SynGCN来解决这个问题,SynGCN是一种灵活的基于图卷积的学习词嵌入的方法。SynGCN在不增加词表大小的情况下利用单词的dependency context。SynGCN学习的词嵌入在各种内部和外部任务上都优于现有方法,在与ELMo一起使用时提供优势。我们还提出了SemGCN,这是一个有效的框架,用于整合不同的语义知识,以进一步增强所学习的单词表示。我们提供了两个模型的源代码,以鼓励可重复的研究。

网址: https://arxiv.org/abs/1809.04283

代码链接: http://github.com/malllabiisc/WordGCN

8、 GraphRel: Modeling Text as Relational Graphs for Joint Entity and Relation Extraction(GraphRel: 将文本建模为关系图,用于实体和关系抽取)

ACL ’19

作者:Tsu-Jui Fu, Peng-Hsuan Li, Wei-Yun Ma

摘要:本文提出了一种利用图卷积网络(GCNs)联合学习命名实体和关系的端到端关系抽取模型GraphRel。与之前的baseline相比,我们通过关系加权GCN来考虑命名实体和关系之间的交互,从而更好地提取关系。线性结构和依赖结构都用于提取文本的序列特征和区域特征,并利用完整的词图进一步提取文本所有词对之间的隐式特征。基于图的方法大大提高了对重叠关系的预测能力。我们在两个公共数据集NYT和webnlg上评估了GraphRel。结果表明,GraphRel在大幅度提高recall的同时,保持了较高的precision。GraphRel的性能也比之前的工作好3.2%和5.8% (F1 score),实现了关系抽取的最先进的方法。

网址: https://tsujuifu.github.io/projs/acl19_graph-rel.html

代码链接: https://github.com/tsujuifu/pytorch_graph-rel

9、Multi-hop Reading Comprehension across Multiple Documents by Reasoning over Heterogeneous Graphs(通过对异构图进行推理,实现跨多个文档的Multi-hop阅读理解)

ACL ’19

作者:Ming Tu, Guangtao Wang, Jing Huang, Yun Tang, Xiaodong He, Bowen Zhou

摘要:跨文档的Multi-hop阅读理解(RC)对单文本RC提出了新的挑战,因为它需要对多个文档进行推理才能得到最终答案。在本文中,我们提出了一个新的模型来解决multi-hop RC问题。我们引入了具有不同类型的节点和边的异构图,称为异构文档-实体(HDE)图。HDE图的优点是它包含不同粒度级别的信息,包括特定文档上下文中的候选信息、文档和实体。我们提出的模型可以对HDE图进行推理,节点表示由基于co-attention 和 self-attention的上下文编码器初始化。我们使用基于图神经网络(GNN)的消息传递算法,在提出的HDE图上累积evidence。通过对Qangaroo WIKIHOP数据集的blind测试集的评估,我们的基于HDE图的单模型给出了具有竞争力的结果,并且集成模型达到了最先进的性能。

网址: https://arxiv.org/abs/1905.07374

10、Textbook Question Answering with Multi-modal Context Graph Understanding and Self-supervised Open-set Comprehension(多模态上下文图理解和自监督开放集理解的Textbook问答)

ACL ’19

作者:Daesik Kim, Seonhoon Kim, Nojun Kwak

摘要:在本文中,我们介绍了一种解决教科书问答(TQA)任务的新算法。在分析TQA数据集时,我们主要关注两个相关问题。首先,解决TQA问题需要理解复杂输入数据中的多模态上下文。为了解决从长文本中提取知识特征并与视觉特征相结合的问题,我们从文本和图像中建立了上下文图,并提出了一种基于图卷积网络(GCN)的f-GCN模块。其次,科学术语不会分散在各个章节中,而且主题在TQA数据集中是分开的。为了克服这个所谓的“领域外”问题,在学习QA问题之前,我们引入了一种新的没有任何标注的自监督开放集学习过程。实验结果表明,我们的模型明显优于现有的最先进的方法。此外,消融研究证实,将f-GCN用于从多模态上下文中提取知识的方法和我们新提出的自监督学习过程对于TQA问题都是有效的。

网址: https://arxiv.org/abs/1811.00232

下载链接:https://pan.baidu.com/s/1xDKxGyvF4pGa7_8ipuS0bw 提取码:rr1c

成为VIP会员查看完整内容
0
52
小贴士
相关VIP内容
相关论文
Memory Augmented Graph Neural Networks for Sequential Recommendation
Chen Ma,Liheng Ma,Yingxue Zhang,Jianing Sun,Xue Liu,Mark Coates
11+阅读 · 2019年12月26日
Hyper-SAGNN: a self-attention based graph neural network for hypergraphs
Ruochi Zhang,Yuesong Zou,Jian Ma
11+阅读 · 2019年11月6日
Relation-Aware Graph Attention Network for Visual Question Answering
Linjie Li,Zhe Gan,Yu Cheng,Jingjing Liu
4+阅读 · 2019年10月9日
Chih-Ming Chen,Chuan-Ju Wang,Ming-Feng Tsai,Yi-Hsuan Yang
5+阅读 · 2019年2月19日
HyperGCN: Hypergraph Convolutional Networks for Semi-Supervised Classification
Naganand Yadati,Madhav Nimishakavi,Prateek Yadav,Anand Louis,Partha Talukdar
10+阅读 · 2018年9月7日
RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems
Hongwei Wang,Fuzheng Zhang,Jialin Wang,Miao Zhao,Wenjie Li,Xing Xie,Minyi Guo
6+阅读 · 2018年8月7日
ThaiBinh Nguyen,Atsuhiro Takasu
7+阅读 · 2018年5月17日
Guangneng Hu,Yu Zhang,Qiang Yang
9+阅读 · 2018年4月20日
Hongwei Wang,Fuzheng Zhang,Jialin Wang,Miao Zhao,Wenjie Li,Xing Xie,Minyi Guo
10+阅读 · 2018年3月9日
Jing Li,Pengjie Ren,Zhumin Chen,Zhaochun Ren,Jun Ma
5+阅读 · 2017年11月13日
Top