【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞 - 专知VIP

会员服务 ·

3

陈健飞 · 图卷积网络 · 朱军 · CCF优秀博士学位论文奖 · 博士论文 ·

2019 年 11 月 8 日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

论文摘要：本文基于方差缩减、拒绝采样、访存优化等技术，研究了隐变量模型和深度表示学习两类模型的高效算法，并研究了这些算法在文本分析、生成式模型、图节点分类等多个任务中的应用。具体地，本文创新点有：

提出隐变量模型的方差缩减 EM 算法，并给出了其局部收敛速度和全局收敛性的理论结果。
提出了缓存高效的 O(1) 时间复杂度主题模型采样算法，该算法较之前算法提速了 5-15 倍，且能扩展到数亿文档、数百万主题、上万 CPU 核的场景。
提出了结构化主题模型的高效算法，具体包括层次化主题模型的部分坍缩吉布斯采样算法，将该模型扩展到了比之前大5个数量级的数据集上；以及有监督主题模型的坐标下降、拒绝采样算法，较之前算法加速4倍。
提出了总体匹配差异，一个两分布之间距离基于样本的估计；证明了总体匹配差异的一致性，并讨论了其在领域自适应、深度生成模型上的应用。
提出了一个基于控制变量的图卷积网络高效随机训练算法，并给出了其收敛性证明和实验结果，较之前算法收敛速度快了7倍。

关键词：表示学习；隐变量模型；主题模型；采样算法；图卷积网络

作者介绍：陈健飞，他目前是清华大学计算机科学与技术系的博士研究生，他的博士生导师是朱军。他研究兴趣是大规模机器学习，尤其是可扩展的深层生成模型和深层主题模型。之前，他专注于扩展各种主题模型，包括LDA、CTM、DTM等。

成为VIP会员查看完整内容

表示学习的高效算法.pdf

48

相关内容

陈健飞

陈健飞，他目前是清华大学计算机科学与技术系的博士研究生，他的博士生导师是朱军。他研究兴趣是大规模机器学习，尤其是可扩展的深层生成模型和深层主题模型。之前，他专注于扩展各种主题模型，包括LDA、CTM、DTM等。

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

专知会员服务

269+阅读 · 2020年1月4日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

49+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

专知会员服务

32+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

专知会员服务

39+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现，清华大学朱晓伟

【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现，清华大学朱晓伟

专知会员服务

51+阅读 · 2019年11月8日

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

专知会员服务

136+阅读 · 2019年11月7日

【清华大学博士论文】面向社会计算的网络表示学习，涂存超

【清华大学博士论文】面向社会计算的网络表示学习，涂存超

专知会员服务

76+阅读 · 2019年11月7日

【新书】图神经网络导论，清华大学刘知远老师著作

【新书】图神经网络导论，清华大学刘知远老师著作

专知

139+阅读 · 2020年6月12日

精选论文 | 网络结构搜索-单目标跟踪【附打包下载】

精选论文 | 网络结构搜索-单目标跟踪【附打包下载】

人工智能前沿讲习班

3+阅读 · 2019年7月2日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

大讲堂 | 基于对抗学习和知识蒸馏的多模型集成算法

大讲堂 | 基于对抗学习和知识蒸馏的多模型集成算法

AI科技评论

4+阅读 · 2018年12月27日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

刘知远 | 语义表示学习

刘知远 | 语义表示学习

开放知识图谱

16+阅读 · 2018年8月9日

线上 | 景驰科技软件工程师陈国斌：基于知识蒸馏的模型压缩与加速

线上 | 景驰科技软件工程师陈国斌：基于知识蒸馏的模型压缩与加速

机器学习研究会

11+阅读 · 2018年1月16日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

干货 | 微软亚洲研究院高级研究员危夷晨：基于光流的视频语义分割和物体检测

干货 | 微软亚洲研究院高级研究员危夷晨：基于光流的视频语义分割和物体检测

机器学习研究会

8+阅读 · 2017年8月3日

Weight Poisoning Attacks on Pre-trained Models

Weight Poisoning Attacks on Pre-trained Models

Arxiv

5+阅读 · 2020年4月14日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

A Sketch-Based System for Semantic Parsing

A Sketch-Based System for Semantic Parsing

Arxiv

4+阅读 · 2019年9月12日

Efficient Parameter-free Clustering Using First Neighbor Relations

Efficient Parameter-free Clustering Using First Neighbor Relations

Arxiv

7+阅读 · 2019年2月28日

Discovery and recognition of motion primitives in human activities

Discovery and recognition of motion primitives in human activities

Arxiv

4+阅读 · 2019年2月4日

To Cluster, or Not to Cluster: An Analysis of Clusterability Methods

To Cluster, or Not to Cluster: An Analysis of Clusterability Methods

Arxiv

4+阅读 · 2018年8月24日

Diverse Few-Shot Text Classification with Multiple Metrics

Arxiv

6+阅读 · 2018年5月19日

FSSD: Feature Fusion Single Shot Multibox Detector

Arxiv

8+阅读 · 2018年5月17日

CuLDA_CGS: Solving Large-scale LDA Problems on GPUs

Arxiv

3+阅读 · 2018年3月13日

Practical sketching algorithms for low-rank matrix approximation

Arxiv

4+阅读 · 2018年1月2日

VIP会员

相关主题

图卷积网络

CCF优秀博士学位论文奖

相关VIP内容

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

专知会员服务

269+阅读 · 2020年1月4日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

49+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

专知会员服务

32+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

专知会员服务

39+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现，清华大学朱晓伟

【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现，清华大学朱晓伟

专知会员服务

51+阅读 · 2019年11月8日

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

专知会员服务

136+阅读 · 2019年11月7日

【清华大学博士论文】面向社会计算的网络表示学习，涂存超

【清华大学博士论文】面向社会计算的网络表示学习，涂存超

专知会员服务

76+阅读 · 2019年11月7日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】在低维与高维空间中对潜在表征的分析、建模与变换

《美军使用大语言模型技术生成领域特定文档》2025最新379页

【NeurIPS 2025】以语言为中心的全模态表征学习的可扩展性研究

智能体化多模态大语言模型综述

相关资讯

【新书】图神经网络导论，清华大学刘知远老师著作

【新书】图神经网络导论，清华大学刘知远老师著作

专知

139+阅读 · 2020年6月12日

精选论文 | 网络结构搜索-单目标跟踪【附打包下载】

精选论文 | 网络结构搜索-单目标跟踪【附打包下载】

人工智能前沿讲习班

3+阅读 · 2019年7月2日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

大讲堂 | 基于对抗学习和知识蒸馏的多模型集成算法

大讲堂 | 基于对抗学习和知识蒸馏的多模型集成算法

AI科技评论

4+阅读 · 2018年12月27日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

刘知远 | 语义表示学习

刘知远 | 语义表示学习

开放知识图谱

16+阅读 · 2018年8月9日

线上 | 景驰科技软件工程师陈国斌：基于知识蒸馏的模型压缩与加速

线上 | 景驰科技软件工程师陈国斌：基于知识蒸馏的模型压缩与加速

机器学习研究会

11+阅读 · 2018年1月16日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

干货 | 微软亚洲研究院高级研究员危夷晨：基于光流的视频语义分割和物体检测

干货 | 微软亚洲研究院高级研究员危夷晨：基于光流的视频语义分割和物体检测

机器学习研究会

8+阅读 · 2017年8月3日

相关论文

Weight Poisoning Attacks on Pre-trained Models

Weight Poisoning Attacks on Pre-trained Models

Arxiv

5+阅读 · 2020年4月14日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

A Sketch-Based System for Semantic Parsing

A Sketch-Based System for Semantic Parsing

Arxiv

4+阅读 · 2019年9月12日

Efficient Parameter-free Clustering Using First Neighbor Relations

Efficient Parameter-free Clustering Using First Neighbor Relations

Arxiv

7+阅读 · 2019年2月28日

Discovery and recognition of motion primitives in human activities

Discovery and recognition of motion primitives in human activities

Arxiv

4+阅读 · 2019年2月4日

To Cluster, or Not to Cluster: An Analysis of Clusterability Methods

To Cluster, or Not to Cluster: An Analysis of Clusterability Methods

Arxiv

4+阅读 · 2018年8月24日

Diverse Few-Shot Text Classification with Multiple Metrics

Arxiv

6+阅读 · 2018年5月19日

FSSD: Feature Fusion Single Shot Multibox Detector

Arxiv

8+阅读 · 2018年5月17日

CuLDA_CGS: Solving Large-scale LDA Problems on GPUs

Arxiv

3+阅读 · 2018年3月13日

Practical sketching algorithms for low-rank matrix approximation

Arxiv

4+阅读 · 2018年1月2日

微信扫码咨询专知VIP会员