控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf - 专知VIP

会员服务 ·

29

大模型 · 文本生成 · ChatGPT ·

2023 年 6 月 5 日

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

随着ChatGPT等服务被部署到数百万用户中，生成语言模型最近大受欢迎。这些神经模型令人着迷、有用，而且令人难以置信地神秘:我们不是设计我们希望它们做的事情，而是将它们推向正确的方向，并且必须发现它们能够做什么。但是我们怎么能依赖这些难以理解的系统呢?

本次演讲将描述我们希望从文本生成模型中获得的一些关键特征，例如一致性和正确性，并展示我们如何设计算法以更可靠地生成具有这些属性的文本。我们还将强调使用这种模型的一些挑战，包括需要发现和命名新的和通常意想不到的突发行为。最后，我们将讨论这对理解模型的重大挑战的影响，以便我们可以安全地控制它们的行为。

Ari Holtzman是华盛顿大学的博士生。他的研究广泛关注文本的生成模型:我们如何使用它们，如何更好地理解它们。他的研究兴趣广泛，从对话(包括在2017年赢得第一届亚马逊Alexa奖)到文本生成的基础研究，如提出Nucleus Sampling，这是一种广泛用于部署系统(如GPT-3 API和学术研究)的解码算法。Ari在纽约大学完成了计算机科学和语言哲学相结合的跨学科学位。

成为VIP会员查看完整内容

64

相关内容

大模型

大模型是基于海量多源数据打造的预训练模型，是对原有算法模型的技术升级和产品迭代，用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习，以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。

大型语言模型的挑战与应用，72页pdf

大型语言模型的挑战与应用，72页pdf

专知会员服务

91+阅读 · 2023年7月21日

《大型语言模型》最新全面概述

《大型语言模型》最新全面概述

专知会员服务

109+阅读 · 2023年7月14日

【ACL2023】从语言模型生成文本,140页ppt

【ACL2023】从语言模型生成文本,140页ppt

专知会员服务

45+阅读 · 2023年7月10日

文本到图像扩散模型有何进展？KAIST最新《生成式人工智能中的文本到图像扩散模型》综述

文本到图像扩散模型有何进展？KAIST最新《生成式人工智能中的文本到图像扩散模型》综述

专知会员服务

42+阅读 · 2023年3月16日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

66+阅读 · 2022年11月30日

5400亿！谷歌「Pathways语言模型」发布，能理解做推理生成代码

5400亿！谷歌「Pathways语言模型」发布，能理解做推理生成代码

专知会员服务

40+阅读 · 2022年4月5日

神经文本生成可用么？斯坦福Abigail博士论文《开放式文本和对话的神经生成》，192页pdf

专知会员服务

26+阅读 · 2021年9月1日

【神经语言生成：形式化，方法与评价，70页pdf】

【神经语言生成：形式化，方法与评价，70页pdf】

专知会员服务

37+阅读 · 2020年8月8日

【实战电子书+代码】自然语言处理的实战，545页pdf，使用Python理解、分析和生成文本

【实战电子书+代码】自然语言处理的实战，545页pdf，使用Python理解、分析和生成文本

专知会员服务

265+阅读 · 2019年12月28日

【综述】关键词生成，附10页pdf论文下载

【综述】关键词生成，附10页pdf论文下载

专知会员服务

54+阅读 · 2019年11月20日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

专知

22+阅读 · 2023年4月10日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

24+阅读 · 2023年4月4日

【MIT博士论文】控制神经语言生成，147页pdf

【MIT博士论文】控制神经语言生成，147页pdf

专知

1+阅读 · 2022年9月2日

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

专知

7+阅读 · 2022年8月15日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

理解人类推理的深度学习

理解人类推理的深度学习

论智

19+阅读 · 2018年11月7日

【教程】如何使用深度学习为照片自动生成文本描述？

【教程】如何使用深度学习为照片自动生成文本描述？

GAN生成式对抗网络

20+阅读 · 2017年11月19日

教程 | 如何使用深度学习为照片自动生成文本描述？

教程 | 如何使用深度学习为照片自动生成文本描述？

机器之心

10+阅读 · 2017年11月15日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

GPU加速和风格感知的艺术图像和谐克隆

国家自然科学基金

4+阅读 · 2014年12月31日

几类随机浅水波方程（组）的研究

国家自然科学基金

0+阅读 · 2013年12月31日

具有表现力的维吾尔语可视语音合成技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

视频中交互行为的表示与理解方法

国家自然科学基金

1+阅读 · 2012年12月31日

视频中交互行为的自动分析与理解

国家自然科学基金

1+阅读 · 2012年12月31日

对象模型上交互式修复生成技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于模型的测试用例优化生成与自动执行

国家自然科学基金

0+阅读 · 2011年12月31日

噪音环境下移动进程的可靠性与安全性

国家自然科学基金

0+阅读 · 2009年12月31日

应急任务生成的决策机制与管理支持方法研究

国家自然科学基金

4+阅读 · 2009年12月31日

The Importance of Distrust in AI

The Importance of Distrust in AI

Arxiv

0+阅读 · 2023年7月25日

Improved Solution Search Performance of Constrained MOEA/D Hybridizing Directional Mating and Local Mating

Arxiv

0+阅读 · 2023年7月24日

YOLOPose V2: Understanding and Improving Transformer-based 6D Pose Estimation

Arxiv

0+阅读 · 2023年7月21日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

40+阅读 · 2023年4月19日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

472+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT

Arxiv

34+阅读 · 2023年3月7日

Explainable Artificial Intelligence for Autonomous Driving: A Comprehensive Overview and Field Guide for Future Research Directions

Arxiv

18+阅读 · 2021年12月21日

VIP会员

相关主题

相关VIP内容

大型语言模型的挑战与应用，72页pdf

大型语言模型的挑战与应用，72页pdf

专知会员服务

91+阅读 · 2023年7月21日

《大型语言模型》最新全面概述

《大型语言模型》最新全面概述

专知会员服务

109+阅读 · 2023年7月14日

【ACL2023】从语言模型生成文本,140页ppt

【ACL2023】从语言模型生成文本,140页ppt

专知会员服务

45+阅读 · 2023年7月10日

文本到图像扩散模型有何进展？KAIST最新《生成式人工智能中的文本到图像扩散模型》综述

文本到图像扩散模型有何进展？KAIST最新《生成式人工智能中的文本到图像扩散模型》综述

专知会员服务

42+阅读 · 2023年3月16日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

66+阅读 · 2022年11月30日

5400亿！谷歌「Pathways语言模型」发布，能理解做推理生成代码

5400亿！谷歌「Pathways语言模型」发布，能理解做推理生成代码

专知会员服务

40+阅读 · 2022年4月5日

神经文本生成可用么？斯坦福Abigail博士论文《开放式文本和对话的神经生成》，192页pdf

专知会员服务

26+阅读 · 2021年9月1日

【神经语言生成：形式化，方法与评价，70页pdf】

【神经语言生成：形式化，方法与评价，70页pdf】

专知会员服务

37+阅读 · 2020年8月8日

【实战电子书+代码】自然语言处理的实战，545页pdf，使用Python理解、分析和生成文本

【实战电子书+代码】自然语言处理的实战，545页pdf，使用Python理解、分析和生成文本

专知会员服务

265+阅读 · 2019年12月28日

【综述】关键词生成，附10页pdf论文下载

【综述】关键词生成，附10页pdf论文下载

专知会员服务

54+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军特种作战条令》最新102页

《洛克希德SR-71“黑鸟”侦察机动力系统》21页slides

美空军作战实验室通过人工智能和指挥控制技术创新推进杀伤链

《指挥控制能力分析方法论》最新报告

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

专知

22+阅读 · 2023年4月10日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

24+阅读 · 2023年4月4日

【MIT博士论文】控制神经语言生成，147页pdf

【MIT博士论文】控制神经语言生成，147页pdf

专知

1+阅读 · 2022年9月2日

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

专知

7+阅读 · 2022年8月15日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

理解人类推理的深度学习

理解人类推理的深度学习

论智

19+阅读 · 2018年11月7日

【教程】如何使用深度学习为照片自动生成文本描述？

【教程】如何使用深度学习为照片自动生成文本描述？

GAN生成式对抗网络

20+阅读 · 2017年11月19日

教程 | 如何使用深度学习为照片自动生成文本描述？

教程 | 如何使用深度学习为照片自动生成文本描述？

机器之心

10+阅读 · 2017年11月15日

相关基金

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

GPU加速和风格感知的艺术图像和谐克隆

国家自然科学基金

4+阅读 · 2014年12月31日

几类随机浅水波方程（组）的研究

国家自然科学基金

0+阅读 · 2013年12月31日

具有表现力的维吾尔语可视语音合成技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

视频中交互行为的表示与理解方法

国家自然科学基金

1+阅读 · 2012年12月31日

视频中交互行为的自动分析与理解

国家自然科学基金

1+阅读 · 2012年12月31日

对象模型上交互式修复生成技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于模型的测试用例优化生成与自动执行

国家自然科学基金

0+阅读 · 2011年12月31日

噪音环境下移动进程的可靠性与安全性

国家自然科学基金

0+阅读 · 2009年12月31日

应急任务生成的决策机制与管理支持方法研究

国家自然科学基金

4+阅读 · 2009年12月31日

相关论文

The Importance of Distrust in AI

The Importance of Distrust in AI

Arxiv

0+阅读 · 2023年7月25日

Improved Solution Search Performance of Constrained MOEA/D Hybridizing Directional Mating and Local Mating

Arxiv

0+阅读 · 2023年7月24日

YOLOPose V2: Understanding and Improving Transformer-based 6D Pose Estimation

Arxiv

0+阅读 · 2023年7月21日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

40+阅读 · 2023年4月19日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

472+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT

Arxiv

34+阅读 · 2023年3月7日

Explainable Artificial Intelligence for Autonomous Driving: A Comprehensive Overview and Field Guide for Future Research Directions

Arxiv

18+阅读 · 2021年12月21日

微信扫码咨询专知VIP会员