【ACL2022报告】生成更好文本：概率文本生成新采样方法，ETH-Ryan Cotterell - 专知

会员服务 ·

0

【ACL2022报告】生成更好文本：概率文本生成新采样方法，ETH-Ryan Cotterell

2022 年 5 月 29 日 专知

今天的神经语言模型似乎很好地模拟了句子的分布情况，也就是说，它们能够给递出的文本分配高概率。然而，在用于生成文本时，这些相同的模型经常表现不佳——实际上，文本神经语言模型放置的高概率通常是枯燥和重复的。所以，一个好奇的人可能会问:这是怎么回事?在这次演讲中，我将通过信息理论的视角来探讨这一明显的矛盾。具体来说，我认为人类使用语言作为一种沟通渠道。在这种情况下，人们往往会说出既简洁高效，又容易理解的句子。因此，我断言，当我们使用语言模型来生成文本时，我们应该采用类似的原则。这一原则导致了一个简单的抽样策略，我称之为典型抽样。典型的抽样不是每次迭代都从分布的高概率区域中选择单词，而是选择信息量(负对数概率)接近条件分布p(y | y1，…，yk)熵的单词，即分布的平均信息量。我们发现，典型抽样在质量方面优于最近提出的几种抽样算法，同时持续减少退化重复的数量。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“PTG” 就可以获取《【ACL2022报告】生成更好文本：概率文本生成新采样方法，ETH-Ryan Cotterell》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

0

相关内容

概率文本生成

概率文本生成

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知会员服务

38+阅读 · 2022年7月14日

META微软等最新ACL2022教程《非自回归序列生成》，168页ppt

META微软等最新ACL2022教程《非自回归序列生成》，168页ppt

专知会员服务

21+阅读 · 2022年6月3日

少样本NLP？ Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术，附328页ppt

少样本NLP？ Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术，附328页ppt

专知会员服务

55+阅读 · 2022年5月26日

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

专知会员服务

13+阅读 · 2022年3月12日

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知会员服务

33+阅读 · 2022年3月3日

【AAAI2022】上下文感知的词语替换与文本溯源

【AAAI2022】上下文感知的词语替换与文本溯源

专知会员服务

18+阅读 · 2022年1月23日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

最新《生成式语言模型: 信息论视角》报告，292页ppt

最新《生成式语言模型: 信息论视角》报告，292页ppt

专知会员服务

29+阅读 · 2020年11月9日

【Google-Mila】你的GAN实际上是一个基于能量的模型，你应该使用鉴别器驱动的潜在采样，Your GAN is Secretly an Energy-based Model and You Should Use Discriminator Driven Latent Sampling

【Google-Mila】你的GAN实际上是一个基于能量的模型，你应该使用鉴别器驱动的潜在采样，Your GAN is Secretly an Energy-based Model and You Should Use Discriminator Driven Latent Sampling

专知会员服务

30+阅读 · 2020年3月28日

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

专知会员服务

14+阅读 · 2020年3月8日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知

0+阅读 · 2022年7月14日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知

2+阅读 · 2022年7月12日

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

专知

0+阅读 · 2022年3月6日

【AAAI2022】上下文感知的词语替换与文本溯源

【AAAI2022】上下文感知的词语替换与文本溯源

专知

0+阅读 · 2022年1月23日

NeurIPS 2021 | 通过动态图评分匹配预测分子构象

NeurIPS 2021 | 通过动态图评分匹配预测分子构象

专知

1+阅读 · 2021年12月4日

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

专知

0+阅读 · 2021年11月24日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知

0+阅读 · 2021年11月14日

【AAAI2021】生成式Transformer的对比三元组提取

【AAAI2021】生成式Transformer的对比三元组提取

专知

11+阅读 · 2021年2月8日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

半参数空间自回归模型的理论研究及应用

国家自然科学基金

1+阅读 · 2015年12月31日

麦冬皂苷通过下调lnc-MALAT1抑制NSCLC血管生成的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂场景中高维曲线的Hough变换检测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多基线立体匹配中的立体择优模型构建及去冗方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

行为叙事的空间启动- - 以空间句法为研究媒介的建筑空间生成研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向中文文本的事件时空语义解析方法研究

国家自然科学基金

3+阅读 · 2013年12月31日

血清中“不可见”小分子代谢物定量测定的NMR方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于因果构造和推理的专家判断关键技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

大型语义辞典的自动生成及在文本分析中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

WEB智能搜索中的文本内容信任判定方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

Contextual Information and Commonsense Based Prompt for Emotion Recognition in Conversation

Arxiv

0+阅读 · 2022年7月27日

Teaching Programming to Novices Using the codeBoot Online Environment

Arxiv

0+阅读 · 2022年7月26日

On joint training with interfaces for spoken language understanding

Arxiv

0+阅读 · 2022年7月25日

Model-based Unbiased Learning to Rank

Arxiv

0+阅读 · 2022年7月24日

aflow.org: A Web Ecosystem of Databases, Software and Tools

Arxiv

0+阅读 · 2022年7月23日

Proceedings Tenth and Eleventh International Workshop on Trends in Functional Programming In Education

Arxiv

0+阅读 · 2022年7月23日

Sound and Complete Neural Network Repair with Minimality and Locality Guarantees

Arxiv

0+阅读 · 2022年7月22日

Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting

Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting

Arxiv

21+阅读 · 2020年12月17日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

Neural Approaches to Conversational AI

Arxiv

26+阅读 · 2018年9月21日

VIP会员

相关主题

概率文本生成

神经语言模型

相关VIP内容

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知会员服务

38+阅读 · 2022年7月14日

META微软等最新ACL2022教程《非自回归序列生成》，168页ppt

META微软等最新ACL2022教程《非自回归序列生成》，168页ppt

专知会员服务

21+阅读 · 2022年6月3日

少样本NLP？ Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术，附328页ppt

少样本NLP？ Allen等ACL2022《少样本自然语言处理》教程，阐述最新前沿技术，附328页ppt

专知会员服务

55+阅读 · 2022年5月26日

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

专知会员服务

13+阅读 · 2022年3月12日

【CVPR2022】三元组对比学习的视觉-语言预训练

【CVPR2022】三元组对比学习的视觉-语言预训练

专知会员服务

33+阅读 · 2022年3月3日

【AAAI2022】上下文感知的词语替换与文本溯源

【AAAI2022】上下文感知的词语替换与文本溯源

专知会员服务

18+阅读 · 2022年1月23日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

最新《生成式语言模型: 信息论视角》报告，292页ppt

最新《生成式语言模型: 信息论视角》报告，292页ppt

专知会员服务

29+阅读 · 2020年11月9日

【Google-Mila】你的GAN实际上是一个基于能量的模型，你应该使用鉴别器驱动的潜在采样，Your GAN is Secretly an Energy-based Model and You Should Use Discriminator Driven Latent Sampling

【Google-Mila】你的GAN实际上是一个基于能量的模型，你应该使用鉴别器驱动的潜在采样，Your GAN is Secretly an Energy-based Model and You Should Use Discriminator Driven Latent Sampling

专知会员服务

30+阅读 · 2020年3月28日

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

【Google-斯坦福-ICLR2020】ELECTRA:预训练文本编码器作为鉴别器而不是生成器

专知会员服务

14+阅读 · 2020年3月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知

0+阅读 · 2022年7月14日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知

2+阅读 · 2022年7月12日

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

【CVPR2022】高分辨率和多样化的视频-文本预训练模型

专知

0+阅读 · 2022年3月6日

【AAAI2022】上下文感知的词语替换与文本溯源

【AAAI2022】上下文感知的词语替换与文本溯源

专知

0+阅读 · 2022年1月23日

NeurIPS 2021 | 通过动态图评分匹配预测分子构象

NeurIPS 2021 | 通过动态图评分匹配预测分子构象

专知

1+阅读 · 2021年12月4日

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

专知

0+阅读 · 2021年11月24日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知

0+阅读 · 2021年11月14日

【AAAI2021】生成式Transformer的对比三元组提取

【AAAI2021】生成式Transformer的对比三元组提取

专知

11+阅读 · 2021年2月8日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

相关基金

半参数空间自回归模型的理论研究及应用

国家自然科学基金

1+阅读 · 2015年12月31日

麦冬皂苷通过下调lnc-MALAT1抑制NSCLC血管生成的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂场景中高维曲线的Hough变换检测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多基线立体匹配中的立体择优模型构建及去冗方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

行为叙事的空间启动- - 以空间句法为研究媒介的建筑空间生成研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向中文文本的事件时空语义解析方法研究

国家自然科学基金

3+阅读 · 2013年12月31日

血清中“不可见”小分子代谢物定量测定的NMR方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于因果构造和推理的专家判断关键技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

大型语义辞典的自动生成及在文本分析中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

WEB智能搜索中的文本内容信任判定方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Contextual Information and Commonsense Based Prompt for Emotion Recognition in Conversation

Arxiv

0+阅读 · 2022年7月27日

Teaching Programming to Novices Using the codeBoot Online Environment

Arxiv

0+阅读 · 2022年7月26日

On joint training with interfaces for spoken language understanding

Arxiv

0+阅读 · 2022年7月25日

Model-based Unbiased Learning to Rank

Arxiv

0+阅读 · 2022年7月24日

aflow.org: A Web Ecosystem of Databases, Software and Tools

Arxiv

0+阅读 · 2022年7月23日

Proceedings Tenth and Eleventh International Workshop on Trends in Functional Programming In Education

Arxiv

0+阅读 · 2022年7月23日

Sound and Complete Neural Network Repair with Minimality and Locality Guarantees

Arxiv

0+阅读 · 2022年7月22日

Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting

Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting

Arxiv

21+阅读 · 2020年12月17日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

Neural Approaches to Conversational AI

Arxiv

26+阅读 · 2018年9月21日

大家都在搜

大型语言模型

朱克爱德华兹家族

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员