论文题目:面向社会计算的网络表示学习

作者:涂存超

导师:孙茂松, 刘知远

网址:http://nlp.csai.tsinghua.edu.cn/~tcc/#Thesis

论文摘要:在数据挖掘和社交网络分析中,对于网络节点的特征表示一直至关重要。随 着大规模社会网络的出现,传统的网络表示方法面临着计算效率以及可解释性的 问题。此外,这些社会网络往往蕴含着丰富的异构信息,这些特点使得已有的网 络表示方法不能很好的处理这些大规模社会网络。 网络表示学习(NetworkRepresentationLearning),也就是网络嵌入(Network Embedding),目的是为网络中的节点学习一个低维实值的向量表示。每个节点对 应的表示向量蕴含了该节点的网络结构信息以及其它异构信息,这些表示向量一 般被当作特征向量,来进行进一步的网络分析任务,例如节点分类、链接预测、社 区发现等。本文针对网络节点表示已有工作的不足,提出了在社会网络中学习节 点显式及隐式表示的思路,来学习高质量的网络节点特征向量和提高社交网络分 析任务的效果。为了学习网络节点显式的特征表示,我们进行了如下工作:(1)基 于词项的显式网络表示:针对网络节点分类任务,我们提出一种双层分类模型,融 合利用社交网络用户异构文本信息和网络结构信息,来进行职业预测任务。(2)基 于主题标签的显式网络表示:为了提高用户特征表示的可解释性问题,我们提出 利用显式的标签来表示用户节点,探究标签与社交网络用户社交行为之间的对应 关系,进行用户标签推荐任务。 虽然网络节点显式表示可解释性强,但它面临着计算效率的问题。基于表示 学习在图像、语音、文本等领域成功应用,我们提出了一系列基于深度学习的网 络表示学习的方法,来学习网络节点的隐式低维表示。这些工作包括:(1)基于最 大间隔的隐式网络表示:为了提高网络节点表示的区分性及其在节点分类上的效 果,提出基于最大间隔理论的有区分性的网络表示学习模型,同时训练网络表示 学习模型和最大间隔分类器,显著提升了网络节点分类的效果。(2)上下文相关 的隐式网络表示:针对链接预测任务,提出上下文相关的网络表示学习模型,根据 网络节点交互的邻居节点的不同,结合文本信息来学习节点动态的表示向量。由 于引入了互相注意力机制,该模型能够显著提高链接预测任务的效果。(3)面向 社会关系抽取的隐式网络表示:为了更好的对节点之间边上的语义信息进行建模, 提出基于平移思想的网络表示学习模型,考虑节点之间边上的标签信息,来进行 社会关系抽取任务。(4)社区优化的隐式网络表示:为了考虑社会网络中全局的 社区特征,我们利用网络中的社区与文本中的主题之间的类比关系,提出了社区 优化的网络表示学习模型,来同时学习节点表示和社区发现。

成为VIP会员查看完整内容
phd_slides.pdf
phd_thesis.pdf
16+
0+

相关内容

异构信息网络 (Hetegeneous Information Network 以下简称 HIN),是由 UIUC 的 Han Jiawei 和 UCLA 的 Sun Yizhou 在 2011 年的 VLDB 论文中首次提出。

标签传播(LPA)和图卷积神经网络(GCN)都是图上的消息传递算法。两者都解决了节点分类的任务,但是LPA将节点标签信息传播到图的边缘,而GCN传播并转换节点特征信息。然而,虽然概念相似,LPA和GCN之间的理论关系还没有得到研究。这里我们从两个方面研究了LPA和GCN之间的关系:(1)特征/标签平滑,分析一个节点的特征/标签如何扩散到它的邻居;(2)一个节点的初始特征/标签对另一个节点的最终特征/标签的影响程度。在理论分析的基础上,提出了一种统一GCN和LPA的节点分类端到端模型。在我们的统一模型中,边缘权值是可学习的,LPA作为正则化帮助GCN学习合适的边缘权值,从而提高分类性能。我们的模型也可以看作是基于节点标签的注意力学习权重,它比现有的基于特征的注意力模型更面向任务。在真实图数据的大量实验中,我们的模型在节点分类准确度方面显示出优于目前最先进的基于gcn的方法。

成为VIP会员查看完整内容
18+
0+

论文题目: Relation-Aware Graph Convolutional Networks for Agent-Initiated Social E-Commerce Recommendation

论文摘要:

近年来,agent-initiated社交电子商务模式取得了巨大的成功,这种模式鼓励用户成为销售代理商,通过他们的社交关系来推广商品。这种类型的社交电子商务中的复杂交互可以表述为异构信息网络(HIN),其中三种节点之间的关系有多种类型,分别为用户、销售代理和商品。学习高质量的节点嵌入是研究的重点,图卷积网络(GCNs)是近年来发展起来的最先进的表示学习方法。然而,现有的GCN模型在建模异构关系和有效地从大量邻域中采样相关接收域方面都存在基本的局限性。为了解决这些问题,我们提出了RecoGCN(a RElation-aware CO-attentive GCN model)来有效地聚合HIN中的异构特征。它弥补了目前GCN在使用关系感知聚合器建模异构关系方面的局限性,并利用语义感知元路径为每个节点开辟简洁和相关的接受域。为了有效地融合从不同元路径中学习到的嵌入,我们进一步提出了一种co-attentive机制,通过关注用户、销售代理和商品之间的三种交互来动态地为不同的元路径分配重要性权重。在真实数据集上的大量实验表明,RecoGCN能够学习HIN中有意义的节点嵌入,并且在推荐任务中始终优于baseline方法。

部分作者简介:

Jianxun Lian是微软亚洲研究院研究员,研究兴趣是推荐系统,用户建模,深度学习,NLP。

成为VIP会员查看完整内容
26+
0+
Top