孙茂松,教授,博士生导师,曾任清华大学计算机科学与技术系系主任,现任教育部在线教育研究中心副主任、清华大学计算机系党委书记、清华大学大规模在线开放教育研究中心主任。国家重点基础研究发展计划项目首席科学家、国家社会科学基金重大项目首席专家、教育部在线教育研究中心副主任、教育部教学信息化与教学方法创新指导委员会副主任委员、清华大学大规模在线教育研究中心主任、清华大学-新加坡国立大学下一代搜索技术联合研究中心共同主任。研究领域包括自然语言处理、人工智能、机器学习、社会计算和计算教育学。个人主页:http://nlp.csai.tsinghua.edu.cn/site2/index.php/zh/people?id=16

VIP内容

论文题目:富信息网络表示学习及典型应用问题研究

论文作者:杨成,博士,北京邮电大学计算机学院助理教授,2019年7月毕业于清华大学计算机科学与技术系,从事自然语言处理与社会计算相关方向的研究,博士期间在国内外顶级期刊会议上发表多篇论文,Google Scholar累计获得引用近500次,并担任国内外顶级会议包括ACL、EMNLP、SMP等在内的程序委员会成员和期刊的审稿人。

指导老师:孙茂松,教授,博士生导师,曾任清华大学计算机科学与技术系系主任,现任教育部在线教育研究中心副主任、清华大学计算机系党委书记、清华大学大规模在线开放教育研究中心主任。

论文摘要:网络是表达对象与对象间关系的常用数据形式,在人们的日常生活与工作学 习中无处不在。除去网络的拓扑结构信息之外,真实的网络数据中一般还包含着 根据节点的属性、行为等产生的丰富信息,统称为富信息网络。随着互联网技术 和移动智能设备的发展,富信息网络的数据规模飞速增长,并带来了丰富的应用 任务和巨大的市场价值。在富信息网络数据的规模及其相关应用的研究需求日益 增长的同时,数据驱动的深度学习技术已经在计算机视觉、自然语言处理等多个 领域取得了巨大的成功。如何让已经在多个领域展示出其有效性的机器学习,特 别是深度学习技术,服务于富信息网络数据及其典型应用已经在近年来成为人工 智能领域的研究热点。 传统的邻接矩阵形式的网络表示具有维度过高和数据稀疏两大缺点,使得研 究者们无法在网络数据上应用机器学习和深度学习技术。因此,研究者们转而将 网络中的节点编码为低维稠密的向量表示,称为网络表示或者网络嵌入。为网络 中的节点学习其向量表示的任务称为网络表示学习。本文针对现有的网络表示学 习工作的缺点和不足,系统性地进行了以下五个工作: 针对缺乏对于已有网络表示学习算法的理论分析的问题,本文提出了网络表 示学习的统一框架和增强算法。本工作将大多数现有的只考虑拓扑结构信息的网 络表示学习方法总结为一个统一的两步框架:邻近度矩阵构造和降维,并进一步 提出了网络嵌入更新(NEU)算法,该算法从理论上隐含地近似了高阶邻近度,可 以应用于已有网络表示学习方法以提高它们的性能。 针对现有网络表示学习方法忽略了网络拓扑结构以外的丰富信息的问题,本 文提出了结合富特征信息的网络表示学习。受前一工作中得到的最先进的网络表 示学习算法实际上等同于一种特殊的矩阵分解的结论的启发,该工作以文本特征 为例,在矩阵分解的框架下将节点的特征信息结合到网络表示学习中。 针对现有网络表示学习方法难以应用于相对复杂的典型应用问题的缺点,本 文以网络表示学习技术作为模型底层,并根据特定的富信息网络场景利用包括循 环神经网络、卷积神经网络在内的深度学习模型进行建模,在推荐系统和传播预 测两个富信息网络典型应用问题中,创新性地提出了基于位置的社交网络的推荐 系统、微观层面的信息传播预测和多层面的信息传播预测的应用模型。

成为VIP会员查看完整内容
0
27
Top