【清华大学博士论文】面向社会计算的网络表示学习，涂存超

论文题目：面向社会计算的网络表示学习

作者：涂存超

导师：孙茂松，刘知远

网址：http://nlp.csai.tsinghua.edu.cn/~tcc/#Thesis

论文摘要：在数据挖掘和社交网络分析中，对于网络节点的特征表示一直至关重要。随着大规模社会网络的出现，传统的网络表示方法面临着计算效率以及可解释性的问题。此外，这些社会网络往往蕴含着丰富的异构信息，这些特点使得已有的网络表示方法不能很好的处理这些大规模社会网络。网络表示学习（NetworkRepresentationLearning），也就是网络嵌入（Network Embedding），目的是为网络中的节点学习一个低维实值的向量表示。每个节点对应的表示向量蕴含了该节点的网络结构信息以及其它异构信息，这些表示向量一般被当作特征向量，来进行进一步的网络分析任务，例如节点分类、链接预测、社区发现等。本文针对网络节点表示已有工作的不足，提出了在社会网络中学习节点显式及隐式表示的思路，来学习高质量的网络节点特征向量和提高社交网络分析任务的效果。为了学习网络节点显式的特征表示，我们进行了如下工作：（1）基于词项的显式网络表示：针对网络节点分类任务，我们提出一种双层分类模型，融合利用社交网络用户异构文本信息和网络结构信息，来进行职业预测任务。（2）基于主题标签的显式网络表示：为了提高用户特征表示的可解释性问题，我们提出利用显式的标签来表示用户节点，探究标签与社交网络用户社交行为之间的对应关系，进行用户标签推荐任务。虽然网络节点显式表示可解释性强，但它面临着计算效率的问题。基于表示学习在图像、语音、文本等领域成功应用，我们提出了一系列基于深度学习的网络表示学习的方法，来学习网络节点的隐式低维表示。这些工作包括：（1）基于最大间隔的隐式网络表示：为了提高网络节点表示的区分性及其在节点分类上的效果，提出基于最大间隔理论的有区分性的网络表示学习模型，同时训练网络表示学习模型和最大间隔分类器，显著提升了网络节点分类的效果。（2）上下文相关的隐式网络表示：针对链接预测任务，提出上下文相关的网络表示学习模型，根据网络节点交互的邻居节点的不同，结合文本信息来学习节点动态的表示向量。由于引入了互相注意力机制，该模型能够显著提高链接预测任务的效果。（3）面向社会关系抽取的隐式网络表示：为了更好的对节点之间边上的语义信息进行建模，提出基于平移思想的网络表示学习模型，考虑节点之间边上的标签信息，来进行社会关系抽取任务。（4）社区优化的隐式网络表示：为了考虑社会网络中全局的社区特征，我们利用网络中的社区与文本中的主题之间的类比关系，提出了社区优化的网络表示学习模型，来同时学习节点表示和社区发现。

成为VIP会员查看完整内容