UIUC-Gargi《增强型语言模型》，64页ppt与视频 - 专知VIP

会员服务 ·

22

大模型 · 增强语言模型 ·

2023 年 5 月 12 日

UIUC-Gargi《增强型语言模型》，64页ppt与视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

增强型语言模型：一项综述

这次演讲聚焦于最近的一些研究，这些研究中语言模型（LMs）被赋予了推理能力和使用工具的能力。前者被定义为将可能复杂的任务分解为更简单的子任务，而后者包括调用外部模块，如代码解释器。LMs可以单独或通过启发式方法结合这些增强效果，或者从示例中学习如何这样做。在坚持标准的缺失令牌预测目标的同时，这种增强型LMs可以使用各种可能的非参数化的外部模块来扩展其上下文处理能力，从而偏离纯语言建模范式，并被称为增强型语言模型（ALMs）。缺失令牌的目标允许ALMs学习推理，使用工具，甚至行动，同时仍然执行标准的自然语言任务，并在几个基准测试上超过大多数常规的LMs。

成为VIP会员查看完整内容

37

相关内容

大模型

大模型是基于海量多源数据打造的预训练模型，是对原有算法模型的技术升级和产品迭代，用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习，以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

专知会员服务

34+阅读 · 2023年6月24日

【伯克利博士论文】构建鲁棒且可扩展的大型语言模型，102页pdf

【伯克利博士论文】构建鲁棒且可扩展的大型语言模型，102页pdf

专知会员服务

45+阅读 · 2023年5月16日

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

专知会员服务

21+阅读 · 2023年3月1日

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

专知会员服务

60+阅读 · 2023年2月9日

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知会员服务

44+阅读 · 2022年10月11日

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

专知会员服务

17+阅读 · 2022年3月6日

【CMU】可扩展人工智能白皮书

专知会员服务

28+阅读 · 2021年7月3日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

专知会员服务

16+阅读 · 2020年10月18日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

专知

22+阅读 · 2023年4月10日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知

3+阅读 · 2022年10月11日

牛津Bronstein | 图机器学习的研究趋势？123页ppt+视频

牛津Bronstein | 图机器学习的研究趋势？123页ppt+视频

图与推荐

1+阅读 · 2022年8月29日

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

专知

5+阅读 · 2022年8月11日

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

专知

1+阅读 · 2022年8月10日

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

专知

1+阅读 · 2022年7月29日

【KDD2019知识图谱教程】从海量文本中挖掘和构建异构信息网络，UIUC232页ppt

【KDD2019知识图谱教程】从海量文本中挖掘和构建异构信息网络，UIUC232页ppt

专知

15+阅读 · 2019年8月11日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

CMU大学76页深度学习课程：变分自编码器（VAE, Variational Autoencoder）

CMU大学76页深度学习课程：变分自编码器（VAE, Variational Autoencoder）

专知

27+阅读 · 2018年8月15日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于动态图模型与多元结构化在线学习的视觉目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

聚合物前驱体陶瓷/YSZ热障涂层阻抗谱无损检测方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

石墨烯中弹性波的传播特性研究

国家自然科学基金

0+阅读 · 2013年12月31日

Al-0.2Sc-0.04（Zr,Yb）合金高温蠕变机理

国家自然科学基金

0+阅读 · 2012年12月31日

横向约束钢管混凝土柱低周疲劳性能的研究

国家自然科学基金

0+阅读 · 2011年12月31日

增强型ZnO/ZnMgO异质结高迁移率场效应晶体管研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于本体的深层网络数据集成方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

实时反应式系统中基于ECA规则的推理方法研究

国家自然科学基金

1+阅读 · 2008年12月31日

含裂纹成分连续过渡梯度材料高温时间相关损伤破坏

国家自然科学基金

0+阅读 · 2008年12月31日

Inferring the Goals of Communicating Agents from Actions and Instructions

Arxiv

0+阅读 · 2023年6月28日

The Neuro-Symbolic Inverse Planning Engine (NIPE): Modeling Probabilistic Social Inferences from Linguistic Inputs

Arxiv

0+阅读 · 2023年6月27日

Taking a Respite from Representation Learning for Molecular Property Prediction

Arxiv

0+阅读 · 2023年6月26日

From Word Models to World Models: Translating from Natural Language to the Probabilistic Language of Thought

Arxiv

0+阅读 · 2023年6月23日

DiversiGATE: A Comprehensive Framework for Reliable Large Language Models

Arxiv

0+阅读 · 2023年6月22日

A Survey on ChatGPT: AI-Generated Contents, Challenges, and Solutions

Arxiv

54+阅读 · 2023年5月25日

ChatGPT-Like Large-Scale Foundation Models for Prognostics and Health Management: A Survey and Roadmaps

Arxiv

30+阅读 · 2023年5月12日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

487+阅读 · 2023年3月31日

A Survey on Multi-modal Summarization

Arxiv

49+阅读 · 2021年9月11日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

VIP会员

相关主题

增强语言模型

相关VIP内容

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

专知会员服务

34+阅读 · 2023年6月24日

【伯克利博士论文】构建鲁棒且可扩展的大型语言模型，102页pdf

【伯克利博士论文】构建鲁棒且可扩展的大型语言模型，102页pdf

专知会员服务

45+阅读 · 2023年5月16日

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

专知会员服务

21+阅读 · 2023年3月1日

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

AAAI2023开会了！UIUC等《知识驱动视觉语言预训练》教程，200+Slides全面阐述多模态知识预训练技术

专知会员服务

60+阅读 · 2023年2月9日

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知会员服务

44+阅读 · 2022年10月11日

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

专知会员服务

17+阅读 · 2022年3月6日

【CMU】可扩展人工智能白皮书

专知会员服务

28+阅读 · 2021年7月3日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

专知会员服务

16+阅读 · 2020年10月18日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

热门VIP内容

开通专知VIP会员享更多权益服务

【斯坦福博士论文】基础模型后训练的新方法

欧盟防务准备路线图：目标、冲突与2030之路（附“2030年防务准备路线图”原文）

【AAAI2026】模型不确定性下的在线鲁棒规划：一种基于采样的方法

Transformers 出现以来关系抽取任务的系统综述

相关资讯

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

专知

22+阅读 · 2023年4月10日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知

3+阅读 · 2022年10月11日

牛津Bronstein | 图机器学习的研究趋势？123页ppt+视频

牛津Bronstein | 图机器学习的研究趋势？123页ppt+视频

图与推荐

1+阅读 · 2022年8月29日

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

专知

5+阅读 · 2022年8月11日

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

专知

1+阅读 · 2022年8月10日

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

专知

1+阅读 · 2022年7月29日

【KDD2019知识图谱教程】从海量文本中挖掘和构建异构信息网络，UIUC232页ppt

【KDD2019知识图谱教程】从海量文本中挖掘和构建异构信息网络，UIUC232页ppt

专知

15+阅读 · 2019年8月11日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

CMU大学76页深度学习课程：变分自编码器（VAE, Variational Autoencoder）

CMU大学76页深度学习课程：变分自编码器（VAE, Variational Autoencoder）

专知

27+阅读 · 2018年8月15日

相关基金

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于动态图模型与多元结构化在线学习的视觉目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

聚合物前驱体陶瓷/YSZ热障涂层阻抗谱无损检测方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

石墨烯中弹性波的传播特性研究

国家自然科学基金

0+阅读 · 2013年12月31日

Al-0.2Sc-0.04（Zr,Yb）合金高温蠕变机理

国家自然科学基金

0+阅读 · 2012年12月31日

横向约束钢管混凝土柱低周疲劳性能的研究

国家自然科学基金

0+阅读 · 2011年12月31日

增强型ZnO/ZnMgO异质结高迁移率场效应晶体管研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于本体的深层网络数据集成方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

实时反应式系统中基于ECA规则的推理方法研究

国家自然科学基金

1+阅读 · 2008年12月31日

含裂纹成分连续过渡梯度材料高温时间相关损伤破坏

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Inferring the Goals of Communicating Agents from Actions and Instructions

Arxiv

0+阅读 · 2023年6月28日

The Neuro-Symbolic Inverse Planning Engine (NIPE): Modeling Probabilistic Social Inferences from Linguistic Inputs

Arxiv

0+阅读 · 2023年6月27日

Taking a Respite from Representation Learning for Molecular Property Prediction

Arxiv

0+阅读 · 2023年6月26日

From Word Models to World Models: Translating from Natural Language to the Probabilistic Language of Thought

Arxiv

0+阅读 · 2023年6月23日

DiversiGATE: A Comprehensive Framework for Reliable Large Language Models

Arxiv

0+阅读 · 2023年6月22日

A Survey on ChatGPT: AI-Generated Contents, Challenges, and Solutions

Arxiv

54+阅读 · 2023年5月25日

ChatGPT-Like Large-Scale Foundation Models for Prognostics and Health Management: A Survey and Roadmaps

Arxiv

30+阅读 · 2023年5月12日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

487+阅读 · 2023年3月31日

A Survey on Multi-modal Summarization

Arxiv

49+阅读 · 2021年9月11日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

微信扫码咨询专知VIP会员