【ETZH博士论文】语言模型编程 - 专知VIP

会员服务 ·

4

语言模型编程 · 博士论文 ·

【ETZH博士论文】语言模型编程

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大型语言模型（LLMs）的快速发展正在重塑机器学习领域，实现了前所未有的生成能力。然而，将LLMs与传统软件系统集成时也带来了根本性的挑战，特别是在效率、正确性，以及需要构建结构化编程抽象以协调其概率性特征与传统确定性软件工程系统和实践之间的矛盾。本文将这一趋势视为一种新兴范式，旨在推动我们称之为语言模型编程（Language Model Programming, LMP）的研究进展，通过引入新的程序抽象和算法，实现更高效、更可靠、更可控的LLM编程方式。为此，本文提出了三个核心贡献：首先，引入了一种新的编程语言和运行时系统——语言模型查询语言（LMQL），用于高效地构造提示词并约束与LLM的程序交互；其次，提出了提示草图（Prompt Sketching），这是一种以模板为中心的解码方法，支持结构化、多阶段的LLM交互，同时确保更准确、更有引导性的生成过程；最后，介绍了一种高效的、基于语法的推测性文本生成算法——Domino，该算法旨在满足高吞吐量推理需求，同时延续了LMQL和更广义LMP范式下对生成的可靠性和控制性要求。这些工具和算法显著提升了与LLM进行编程的效率、可靠性与可控性，为构建更先进、更个性化、更自主、且更高效的软件系统奠定了基础——以LLM为核心。为实现这一目标，本文不仅借鉴了传统编程语言领域的研究成果，也融合了LLM的最新进展，以及编译器构建、语法解析器、声明式与命令式编程、自然语言处理中的解码算法等相关技术。

综上所述，这些工具从机器学习与编程语言两个维度显著提升了LLM的可靠性，为语言模型编程这一新兴研究领域做出了重要贡献。

成为VIP会员查看完整内容

6

相关内容

语言模型编程

语言模型编程

【CMU博士论文】深度平衡模型与扩散模型的实践应用：提升效率的方法

【CMU博士论文】深度平衡模型与扩散模型的实践应用：提升效率的方法

专知会员服务

10+阅读 · 5月24日

【NTU博士论文】当深度学习遇上归纳逻辑程序设计

【NTU博士论文】当深度学习遇上归纳逻辑程序设计

专知会员服务

24+阅读 · 5月6日

【MIT博士论文】迈向人工神经科学：语言模型可解释性分析方法

【MIT博士论文】迈向人工神经科学：语言模型可解释性分析方法

专知会员服务

22+阅读 · 4月1日

【博士论文】学习视觉-语言表示以实现多模态理解

【博士论文】学习视觉-语言表示以实现多模态理解

专知会员服务

26+阅读 · 2月8日

【ETHZ博士论文】机器学习代码: 安全性与可靠性

【ETHZ博士论文】机器学习代码: 安全性与可靠性

专知会员服务

19+阅读 · 2024年10月25日

【伯克利博士论文】用于决策制定的基础模型：算法、框架与应用

【伯克利博士论文】用于决策制定的基础模型：算法、框架与应用

专知会员服务

47+阅读 · 2024年8月29日

【MIT博士论文】理解与提升机器学习模型的表征鲁棒性

【MIT博士论文】理解与提升机器学习模型的表征鲁棒性

专知会员服务

26+阅读 · 2024年8月26日

【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

专知会员服务

18+阅读 · 2024年8月14日

【CMU博士论文】理解、正式表征和稳健处理现实世界的分布变迁

【CMU博士论文】理解、正式表征和稳健处理现实世界的分布变迁

专知会员服务

22+阅读 · 2024年7月26日

【MIT博士论文】优化理论与机器学习实践

【MIT博士论文】优化理论与机器学习实践

专知会员服务

94+阅读 · 2022年6月30日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

17+阅读 · 2022年9月4日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

51+阅读 · 2022年4月25日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

172+阅读 · 2019年10月28日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

专知

12+阅读 · 2019年10月13日

【论文笔记】用于Web级推荐系统的图卷积神经网络

【论文笔记】用于Web级推荐系统的图卷积神经网络

专知

20+阅读 · 2019年9月30日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于参数和结构优化的置信规则库推理方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于反馈型级联连接模型的多模态语义SFM方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

面向大数据跨媒体检索的多模态哈希学习方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于代数结构及公理语义的泛型约束方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

99+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

211+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

79+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

464+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

144+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

169+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

语言模型编程

相关VIP内容

【CMU博士论文】深度平衡模型与扩散模型的实践应用：提升效率的方法

【CMU博士论文】深度平衡模型与扩散模型的实践应用：提升效率的方法

专知会员服务

10+阅读 · 5月24日

【NTU博士论文】当深度学习遇上归纳逻辑程序设计

【NTU博士论文】当深度学习遇上归纳逻辑程序设计

专知会员服务

24+阅读 · 5月6日

【MIT博士论文】迈向人工神经科学：语言模型可解释性分析方法

【MIT博士论文】迈向人工神经科学：语言模型可解释性分析方法

专知会员服务

22+阅读 · 4月1日

【博士论文】学习视觉-语言表示以实现多模态理解

【博士论文】学习视觉-语言表示以实现多模态理解

专知会员服务

26+阅读 · 2月8日

【ETHZ博士论文】机器学习代码: 安全性与可靠性

【ETHZ博士论文】机器学习代码: 安全性与可靠性

专知会员服务

19+阅读 · 2024年10月25日

【伯克利博士论文】用于决策制定的基础模型：算法、框架与应用

【伯克利博士论文】用于决策制定的基础模型：算法、框架与应用

专知会员服务

47+阅读 · 2024年8月29日

【MIT博士论文】理解与提升机器学习模型的表征鲁棒性

【MIT博士论文】理解与提升机器学习模型的表征鲁棒性

专知会员服务

26+阅读 · 2024年8月26日

【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

专知会员服务

18+阅读 · 2024年8月14日

【CMU博士论文】理解、正式表征和稳健处理现实世界的分布变迁

【CMU博士论文】理解、正式表征和稳健处理现实世界的分布变迁

专知会员服务

22+阅读 · 2024年7月26日

【MIT博士论文】优化理论与机器学习实践

【MIT博士论文】优化理论与机器学习实践

专知会员服务

94+阅读 · 2022年6月30日

热门VIP内容

开通专知VIP会员享更多权益服务

医疗健康行业：AI应用白皮书

多模态大型语言模型：综述

ACL 2025 Findings | SIPO: 缓解多目标对齐中的偏好冲突

【ETZH博士论文】语言模型编程

相关资讯

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

17+阅读 · 2022年9月4日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

51+阅读 · 2022年4月25日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

172+阅读 · 2019年10月28日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

专知

12+阅读 · 2019年10月13日

【论文笔记】用于Web级推荐系统的图卷积神经网络

【论文笔记】用于Web级推荐系统的图卷积神经网络

专知

20+阅读 · 2019年9月30日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

相关基金

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于参数和结构优化的置信规则库推理方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于反馈型级联连接模型的多模态语义SFM方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

面向大数据跨媒体检索的多模态哈希学习方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于代数结构及公理语义的泛型约束方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

99+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

211+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

79+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

464+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

144+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

169+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员