【纽约大学Sean】神经文本退化:一致性和学习，93页ppt - 专知VIP

会员服务 ·

0

神经文本退化 · 纽约大学 (New York University) ·

2020 年 10 月 18 日

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

神经文本退化:一致性和学习

用最大似然估计训练的神经序列模型已经成为建模和生成文本的标准方法。然而，最近的研究发现了这些模型的问题。在这次谈话中，我们研究了在实践中出现的最大似然学习的退化性质，激发了新的学习方法。我们使用在生成文本中观察到的三个特性来描述简并性:非终止性、逻辑不连贯性和重复性。为了研究非终止性，我们发展了一个理论，允许我们正式证明传统的文本生成方法可以生成具有高概率的无限长序列。为了减少这三种类型的退化，我们开发了两种学习算法:非似然训练(惩罚特定任务的文本属性)和最大似然引导参数搜索(直接优化序列级损失)。

成为VIP会员查看完整内容

16

相关内容

神经文本退化

神经文本退化

【普林斯顿】最新《监督学习数学视角理解》报告，64页ppt

【普林斯顿】最新《监督学习数学视角理解》报告，64页ppt

专知会员服务

45+阅读 · 2020年11月30日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【EMNLP2020】序列知识蒸馏进展，44页ppt

【EMNLP2020】序列知识蒸馏进展，44页ppt

专知会员服务

39+阅读 · 2020年11月21日

【NeurIPS 2020】用人眼注视引导的神经注意力提升自然语言处理任务

【NeurIPS 2020】用人眼注视引导的神经注意力提升自然语言处理任务

专知会员服务

16+阅读 · 2020年10月17日

【德国杜宾根大学博士论文】深度生成模型的稳定性与表达力，279页pdf

【德国杜宾根大学博士论文】深度生成模型的稳定性与表达力，279页pdf

专知会员服务

46+阅读 · 2020年9月9日

【KDD2020视频教程】小数据学习，116页ppt，Learning with Small Data，宾夕法尼亚州立大学

【KDD2020视频教程】小数据学习，116页ppt，Learning with Small Data，宾夕法尼亚州立大学

专知会员服务

23+阅读 · 2020年8月24日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

最新必读的六篇「知识图谱表示学习KGRL」2020顶会论文和代码

最新必读的六篇「知识图谱表示学习KGRL」2020顶会论文和代码

专知会员服务

67+阅读 · 2020年7月17日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

204+阅读 · 2020年5月22日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知会员服务

80+阅读 · 2020年3月13日

如何进行贝叶深度学习？纽约大学Andrew博士视频讲解《贝叶斯深度学习与概率模型构建》134页ppt

如何进行贝叶深度学习？纽约大学Andrew博士视频讲解《贝叶斯深度学习与概率模型构建》134页ppt

专知

8+阅读 · 2020年7月30日

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

专知

34+阅读 · 2020年7月12日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

【ICME2019】智能图像视频编辑，北大教程，400多页PPT

【ICME2019】智能图像视频编辑，北大教程，400多页PPT

专知

11+阅读 · 2019年7月14日

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

专知

23+阅读 · 2019年4月15日

【干货】谷歌大脑：元学习最新进展与挑战（40 PPT下载）

【干货】谷歌大脑：元学习最新进展与挑战（40 PPT下载）

新智元

20+阅读 · 2019年1月29日

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

专知

21+阅读 · 2018年11月20日

115页Slides带你领略深度生成模型全貌（附PPT）

115页Slides带你领略深度生成模型全貌（附PPT）

数据派THU

14+阅读 · 2018年7月31日

谷歌大脑工程师给2018学术顶会划重点：对抗性学习+强化学习

谷歌大脑工程师给2018学术顶会划重点：对抗性学习+强化学习

新智元

30+阅读 · 2018年6月13日

Regularised Least-Squares Regression with Infinite-Dimensional Output Space

Arxiv

0+阅读 · 2020年12月3日

Using dynamical quantization to perform split attempts in online tree regressors

Arxiv

0+阅读 · 2020年12月3日

Partial Gromov-Wasserstein Learning for Partial Graph Matching

Arxiv

0+阅读 · 2020年12月2日

Gaussian Process Regression with Local Explanation

Arxiv

0+阅读 · 2020年12月2日

The massive modular Hamiltonian

Arxiv

0+阅读 · 2020年12月1日

Functional Linear Regression with Mixed Predictors

Arxiv

0+阅读 · 2020年12月1日

A monolithic divergence-conforming HDG scheme for a linear fluid-structure interaction model

Arxiv

0+阅读 · 2020年11月30日

Language GANs Falling Short

Arxiv

7+阅读 · 2018年11月6日

On The Alignment Problem In Multi-Head Attention-Based Neural Machine Translation

On The Alignment Problem In Multi-Head Attention-Based Neural Machine Translation

Arxiv

3+阅读 · 2018年9月11日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

VIP会员

相关主题

神经文本退化

纽约大学 (New York University)

相关VIP内容

【普林斯顿】最新《监督学习数学视角理解》报告，64页ppt

【普林斯顿】最新《监督学习数学视角理解》报告，64页ppt

专知会员服务

45+阅读 · 2020年11月30日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【EMNLP2020】序列知识蒸馏进展，44页ppt

【EMNLP2020】序列知识蒸馏进展，44页ppt

专知会员服务

39+阅读 · 2020年11月21日

【NeurIPS 2020】用人眼注视引导的神经注意力提升自然语言处理任务

【NeurIPS 2020】用人眼注视引导的神经注意力提升自然语言处理任务

专知会员服务

16+阅读 · 2020年10月17日

【德国杜宾根大学博士论文】深度生成模型的稳定性与表达力，279页pdf

【德国杜宾根大学博士论文】深度生成模型的稳定性与表达力，279页pdf

专知会员服务

46+阅读 · 2020年9月9日

【KDD2020视频教程】小数据学习，116页ppt，Learning with Small Data，宾夕法尼亚州立大学

【KDD2020视频教程】小数据学习，116页ppt，Learning with Small Data，宾夕法尼亚州立大学

专知会员服务

23+阅读 · 2020年8月24日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

最新必读的六篇「知识图谱表示学习KGRL」2020顶会论文和代码

最新必读的六篇「知识图谱表示学习KGRL」2020顶会论文和代码

专知会员服务

67+阅读 · 2020年7月17日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

204+阅读 · 2020年5月22日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知会员服务

80+阅读 · 2020年3月13日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

如何进行贝叶深度学习？纽约大学Andrew博士视频讲解《贝叶斯深度学习与概率模型构建》134页ppt

如何进行贝叶深度学习？纽约大学Andrew博士视频讲解《贝叶斯深度学习与概率模型构建》134页ppt

专知

8+阅读 · 2020年7月30日

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

专知

34+阅读 · 2020年7月12日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

【ICME2019】智能图像视频编辑，北大教程，400多页PPT

【ICME2019】智能图像视频编辑，北大教程，400多页PPT

专知

11+阅读 · 2019年7月14日

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

专知

23+阅读 · 2019年4月15日

【干货】谷歌大脑：元学习最新进展与挑战（40 PPT下载）

【干货】谷歌大脑：元学习最新进展与挑战（40 PPT下载）

新智元

20+阅读 · 2019年1月29日

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

专知

21+阅读 · 2018年11月20日

115页Slides带你领略深度生成模型全貌（附PPT）

115页Slides带你领略深度生成模型全貌（附PPT）

数据派THU

14+阅读 · 2018年7月31日

谷歌大脑工程师给2018学术顶会划重点：对抗性学习+强化学习

谷歌大脑工程师给2018学术顶会划重点：对抗性学习+强化学习

新智元

30+阅读 · 2018年6月13日

相关论文

Regularised Least-Squares Regression with Infinite-Dimensional Output Space

Arxiv

0+阅读 · 2020年12月3日

Using dynamical quantization to perform split attempts in online tree regressors

Arxiv

0+阅读 · 2020年12月3日

Partial Gromov-Wasserstein Learning for Partial Graph Matching

Arxiv

0+阅读 · 2020年12月2日

Gaussian Process Regression with Local Explanation

Arxiv

0+阅读 · 2020年12月2日

The massive modular Hamiltonian

Arxiv

0+阅读 · 2020年12月1日

Functional Linear Regression with Mixed Predictors

Arxiv

0+阅读 · 2020年12月1日

A monolithic divergence-conforming HDG scheme for a linear fluid-structure interaction model

Arxiv

0+阅读 · 2020年11月30日

Language GANs Falling Short

Arxiv

7+阅读 · 2018年11月6日

On The Alignment Problem In Multi-Head Attention-Based Neural Machine Translation

On The Alignment Problem In Multi-Head Attention-Based Neural Machine Translation

Arxiv

3+阅读 · 2018年9月11日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

微信扫码咨询专知VIP会员