【ICML2023】基于自然语言指令的受控文本生成 - 专知VIP

会员服务 ·

15

ICML 2023 · 自然语言指令 · 文本生成 ·

2023 年 4 月 28 日

【ICML2023】基于自然语言指令的受控文本生成

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大型语言模型可以生成流畅的文本，并可以按照自然语言指令解决各种任务，而无需特定任务的训练。然而，要控制它们的生成以满足不同应用所需的各种约束条件是非常困难的。在这项工作中，我们提出了INSTRUCTCTG，这是一个受控文本生成框架，它通过依据约束条件的自然语言描述和演示来结合不同的约束条件。特别地，我们首先通过一组现成的自然语言处理工具和简单的启发式方法来提取自然文本中的潜在约束条件。然后，我们将这些约束条件转化为自然语言指令，以形成弱监督的训练数据。通过在输入之前添加约束条件的自然语言描述和一些演示，我们微调了一个预训练的语言模型，以包括各种类型的约束条件。与现有的基于搜索或基于评分的方法相比，INSTRUCTCTG 对不同类型的约束条件更加灵活，并且对生成质量和速度的影响要小得多，因为它不修改解码过程。此外，INSTRUCTCTG 还允许模型通过使用指令调整的语言模型的少量样本任务泛化和上下文学习能力来适应新的约束条件而无需重新训练。代码将在 https://github. com/MichaelZhouwang/InstructCTG 上提供。

成为VIP会员查看完整内容

29

相关内容

ICML 2023

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议。 2023年7月23日至29日周六在夏威夷会议中心举行。

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

专知会员服务

39+阅读 · 2023年5月18日

【CVPR2023】基于文本到图像扩散模型的开放词汇全景分割

【CVPR2023】基于文本到图像扩散模型的开放词汇全景分割

专知会员服务

25+阅读 · 2023年3月12日

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

专知会员服务

21+阅读 · 2023年3月1日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

知识增强的文本生成研究进展

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

CLUE社区最新神器！PromptCLUE：大规模多任务Prompt预训练中文开源模型

CLUE社区最新神器！PromptCLUE：大规模多任务Prompt预训练中文开源模型

新智元

0+阅读 · 2022年10月30日

NAACL 2022 | 基于Prompt的文本生成迁移学习

NAACL 2022 | 基于Prompt的文本生成迁移学习

PaperWeekly

1+阅读 · 2022年8月31日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

52+阅读 · 2019年9月1日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

基于深度学习的交通环境理解与目标检测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

概率依赖增益机制下基于随机发生不完全信息的非线性随机控制与滤波

国家自然科学基金

0+阅读 · 2012年12月31日

上下文感知的Web服务自适应计算模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

应急任务生成的决策机制与管理支持方法研究

国家自然科学基金

4+阅读 · 2009年12月31日

句子语义的视觉表示研究

国家自然科学基金

4+阅读 · 2009年12月31日

Explaining CLIP through Co-Creative Drawings and Interaction

Arxiv

0+阅读 · 2023年6月12日

Generating Language Corrections for Teaching Physical Control Tasks

Arxiv

0+阅读 · 2023年6月12日

Backdooring Neural Code Search

Arxiv

0+阅读 · 2023年6月12日

Diffusion Self-Guidance for Controllable Image Generation

Arxiv

0+阅读 · 2023年6月11日

Language Instructed Reinforcement Learning for Human-AI Coordination

Arxiv

0+阅读 · 2023年6月10日

VIP会员

相关主题

自然语言指令

相关VIP内容

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

专知会员服务

39+阅读 · 2023年5月18日

【CVPR2023】基于文本到图像扩散模型的开放词汇全景分割

【CVPR2023】基于文本到图像扩散模型的开放词汇全景分割

专知会员服务

25+阅读 · 2023年3月12日

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

专知会员服务

21+阅读 · 2023年3月1日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

知识增强的文本生成研究进展

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

热门VIP内容

开通专知VIP会员享更多权益服务

【书籍】从零开始构建文本生成图像生成器：基于 Transformers 与扩散模型

人工智能与未来指挥

【伯克利博士论文】将大语言模型绑定至虚拟人格：实现人类行为模拟

稀疏自编码器综述：解释大语言模型的内部机制

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

CLUE社区最新神器！PromptCLUE：大规模多任务Prompt预训练中文开源模型

CLUE社区最新神器！PromptCLUE：大规模多任务Prompt预训练中文开源模型

新智元

0+阅读 · 2022年10月30日

NAACL 2022 | 基于Prompt的文本生成迁移学习

NAACL 2022 | 基于Prompt的文本生成迁移学习

PaperWeekly

1+阅读 · 2022年8月31日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

52+阅读 · 2019年9月1日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

相关基金

基于深度学习的交通环境理解与目标检测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

概率依赖增益机制下基于随机发生不完全信息的非线性随机控制与滤波

国家自然科学基金

0+阅读 · 2012年12月31日

上下文感知的Web服务自适应计算模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

应急任务生成的决策机制与管理支持方法研究

国家自然科学基金

4+阅读 · 2009年12月31日

句子语义的视觉表示研究

国家自然科学基金

4+阅读 · 2009年12月31日

相关论文

Explaining CLIP through Co-Creative Drawings and Interaction

Arxiv

0+阅读 · 2023年6月12日

Generating Language Corrections for Teaching Physical Control Tasks

Arxiv

0+阅读 · 2023年6月12日

Backdooring Neural Code Search

Arxiv

0+阅读 · 2023年6月12日

Diffusion Self-Guidance for Controllable Image Generation

Arxiv

0+阅读 · 2023年6月11日

Language Instructed Reinforcement Learning for Human-AI Coordination

Arxiv

0+阅读 · 2023年6月10日

微信扫码咨询专知VIP会员