重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展 - 专知VIP

会员服务 ·

202

大模型 · 大型语言模型 · ChatGPT ·

2023 年 4 月 3 日

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

自20世纪50年代图灵测试被提出以来，人类一直在探索机器对语言智能的掌握。语言本质上是一个受语法规则支配的复杂的人类表达系统。这对开发有能力的人工智能(AI)算法来理解和掌握语言提出了重大挑战。作为一种主要的语言建模方法，在过去的二十年中，语言建模在语言理解和生成方面得到了广泛的研究，从统计语言模型发展到神经语言模型。最近，通过在大规模语料库上预训练Transformer模型，人们提出了预训练语言模型(PLM)，在解决各种自然语言处理(NLP)任务方面显示出强大的能力。由于研究人员发现模型缩放可以导致性能提高，他们通过将模型大小增加到更大的尺寸来进一步研究缩放效应。有趣的是，当参数规模超过一定水平时，这些放大的语言模型不仅实现了显著的性能提升，而且显示出一些在小规模语言模型(如BERT)中不存在的特殊能力(如上下文学习)。为了区别参数规模的差异，研究界创造了大型语言模型(LLM)这个术语，用于表示规模巨大的PLM(例如，包含数百亿或千亿参数)。近年来，学术界和工业界对LLMs的研究取得了很大进展，其中最显著的进展是基于LLMs开发的ChatGPT(一个功能强大的人工智能聊天机器人)的推出，引起了社会的广泛关注。LLM的技术发展对整个AI社区产生了重要影响，这将彻底改变我们开发和使用AI算法的方式。鉴于这种快速的技术进步，本综述通过介绍背景、关键发现和主流技术，回顾了LLM的最新进展。重点关注LLM的四个主要方面，即预训练、自适应调优、利用率和能力评估。此外，还总结了开发LLM的可用资源，并讨论了剩余问题，以供未来发展方向。本综述提供了关于LLM的文献的最新综述，对于研究人员和工程师来说，这可以是一个有用的资源。

成为VIP会员查看完整内容

相关内容

大模型

大模型是基于海量多源数据打造的预训练模型，是对原有算法模型的技术升级和产品迭代，用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习，以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。

大模型如何用好？亚马逊最新《大型语言模型(LLMs)实践：ChatGPT》综述，全面概述LLM模型、数据、任务的实战指南

大模型如何用好？亚马逊最新《大型语言模型(LLMs)实践：ChatGPT》综述，全面概述LLM模型、数据、任务的实战指南

专知会员服务

139+阅读 · 2023年4月27日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大训练方法

专知会员服务

149+阅读 · 2023年4月11日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知会员服务

148+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知会员服务

181+阅读 · 2023年4月4日

ChatGPT背后的大模型如何做推理？港中文等最新《自然语言推理》综述详述预训练语言模型推理方法

ChatGPT背后的大模型如何做推理？港中文等最新《自然语言推理》综述详述预训练语言模型推理方法

专知会员服务

116+阅读 · 2023年3月29日

大模型时代知识图谱如何搞？澳联大等最新《知识图谱:机遇与挑战》全面综述，详述知识图谱最新进展

大模型时代知识图谱如何搞？澳联大等最新《知识图谱:机遇与挑战》全面综述，详述知识图谱最新进展

专知会员服务

157+阅读 · 2023年3月28日

ChatGPT引领AIGC！Lehigh最新《AI生成内容(AIGC)》全面综述，44页pdf详述GAN到ChatGPT发展历程

ChatGPT引领AIGC！Lehigh最新《AI生成内容(AIGC)》全面综述，44页pdf详述GAN到ChatGPT发展历程

专知会员服务

171+阅读 · 2023年3月14日

ChatGPT背后的大模型技术如何炼？MSU等最新《预训练基础模型综述》，97页pdf全面阐述BERT到ChatGPT历史脉络

ChatGPT背后的大模型技术如何炼？MSU等最新《预训练基础模型综述》，97页pdf全面阐述BERT到ChatGPT历史脉络

专知会员服务

173+阅读 · 2023年2月22日

Transformer如何训得更快更好？莫纳什大学最新《Transformer高效训练》综述，详述训练Transformer技术

Transformer如何训得更快更好？莫纳什大学最新《Transformer高效训练》综述，详述训练Transformer技术

专知会员服务

58+阅读 · 2023年2月4日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知会员服务

62+阅读 · 2022年11月18日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

专知

24+阅读 · 2023年4月4日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

24+阅读 · 2023年4月4日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

好的知识蒸馏架构是什么样的？蒙特利尔麦吉尔大学最新《知识学习的师生架构》综述论文，12页pdf详述知识蒸馏师生体系结构体系

好的知识蒸馏架构是什么样的？蒙特利尔麦吉尔大学最新《知识学习的师生架构》综述论文，12页pdf详述知识蒸馏师生体系结构体系

专知

1+阅读 · 2022年11月1日

知识图谱KG在NLP的十年研究进展综述

知识图谱KG在NLP的十年研究进展综述

专知

16+阅读 · 2022年10月4日

30年历史回顾，Jeff Dean：我们整理了一份「稀疏专家模型」研究综述

30年历史回顾，Jeff Dean：我们整理了一份「稀疏专家模型」研究综述

机器之心

0+阅读 · 2022年10月3日

送给大模型的「高考」卷：442人联名论文给大模型提出204个任务，谷歌领衔

送给大模型的「高考」卷：442人联名论文给大模型提出204个任务，谷歌领衔

机器之心

1+阅读 · 2022年6月11日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

定性指标偏好感知进化优化及在个性化搜索中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度神经网络的自动作文评分算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

超声造影对兔肝VX2肿瘤转移机制与肿瘤原位消融靶点相关性的研究

国家自然科学基金

0+阅读 · 2014年12月31日

代谢组学数据的多层次融合和模型评价方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

供需不确定下制造企业订单承诺决策研究

国家自然科学基金

1+阅读 · 2013年12月31日

中国未来可持续发展的人口政策研究

国家自然科学基金

4+阅读 · 2011年6月30日

基于周期自适应控制的飞行控制方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

富电性铁、钴和镍配合物对C-H键的活化作用及其应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

WGOS层次化语义系统模型研究

国家自然科学基金

1+阅读 · 2008年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

218+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

Arxiv

11+阅读 · 2019年11月4日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

VIP会员

相关主题

大型语言模型

相关VIP内容

大模型如何用好？亚马逊最新《大型语言模型(LLMs)实践：ChatGPT》综述，全面概述LLM模型、数据、任务的实战指南

大模型如何用好？亚马逊最新《大型语言模型(LLMs)实践：ChatGPT》综述，全面概述LLM模型、数据、任务的实战指南

专知会员服务

139+阅读 · 2023年4月27日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大训练方法

专知会员服务

149+阅读 · 2023年4月11日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知会员服务

148+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知会员服务

181+阅读 · 2023年4月4日

ChatGPT背后的大模型如何做推理？港中文等最新《自然语言推理》综述详述预训练语言模型推理方法

ChatGPT背后的大模型如何做推理？港中文等最新《自然语言推理》综述详述预训练语言模型推理方法

专知会员服务

116+阅读 · 2023年3月29日

大模型时代知识图谱如何搞？澳联大等最新《知识图谱:机遇与挑战》全面综述，详述知识图谱最新进展

大模型时代知识图谱如何搞？澳联大等最新《知识图谱:机遇与挑战》全面综述，详述知识图谱最新进展

专知会员服务

157+阅读 · 2023年3月28日

ChatGPT引领AIGC！Lehigh最新《AI生成内容(AIGC)》全面综述，44页pdf详述GAN到ChatGPT发展历程

ChatGPT引领AIGC！Lehigh最新《AI生成内容(AIGC)》全面综述，44页pdf详述GAN到ChatGPT发展历程

专知会员服务

171+阅读 · 2023年3月14日

ChatGPT背后的大模型技术如何炼？MSU等最新《预训练基础模型综述》，97页pdf全面阐述BERT到ChatGPT历史脉络

ChatGPT背后的大模型技术如何炼？MSU等最新《预训练基础模型综述》，97页pdf全面阐述BERT到ChatGPT历史脉络

专知会员服务

173+阅读 · 2023年2月22日

Transformer如何训得更快更好？莫纳什大学最新《Transformer高效训练》综述，详述训练Transformer技术

Transformer如何训得更快更好？莫纳什大学最新《Transformer高效训练》综述，详述训练Transformer技术

专知会员服务

58+阅读 · 2023年2月4日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知会员服务

62+阅读 · 2022年11月18日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】移动计算摄影的神经场表示

大语言模型遇见法律人工智能：综述

【ICCV2025】InfGen：一种分辨率无关的可扩展图像合成范式

美军用无人地面战车发展：现代战争中超越弹药的多元应用

相关资讯

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

专知

24+阅读 · 2023年4月4日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

24+阅读 · 2023年4月4日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

好的知识蒸馏架构是什么样的？蒙特利尔麦吉尔大学最新《知识学习的师生架构》综述论文，12页pdf详述知识蒸馏师生体系结构体系

好的知识蒸馏架构是什么样的？蒙特利尔麦吉尔大学最新《知识学习的师生架构》综述论文，12页pdf详述知识蒸馏师生体系结构体系

专知

1+阅读 · 2022年11月1日

知识图谱KG在NLP的十年研究进展综述

知识图谱KG在NLP的十年研究进展综述

专知

16+阅读 · 2022年10月4日

30年历史回顾，Jeff Dean：我们整理了一份「稀疏专家模型」研究综述

30年历史回顾，Jeff Dean：我们整理了一份「稀疏专家模型」研究综述

机器之心

0+阅读 · 2022年10月3日

送给大模型的「高考」卷：442人联名论文给大模型提出204个任务，谷歌领衔

送给大模型的「高考」卷：442人联名论文给大模型提出204个任务，谷歌领衔

机器之心

1+阅读 · 2022年6月11日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

相关基金

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

定性指标偏好感知进化优化及在个性化搜索中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度神经网络的自动作文评分算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

超声造影对兔肝VX2肿瘤转移机制与肿瘤原位消融靶点相关性的研究

国家自然科学基金

0+阅读 · 2014年12月31日

代谢组学数据的多层次融合和模型评价方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

供需不确定下制造企业订单承诺决策研究

国家自然科学基金

1+阅读 · 2013年12月31日

中国未来可持续发展的人口政策研究

国家自然科学基金

4+阅读 · 2011年6月30日

基于周期自适应控制的飞行控制方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

富电性铁、钴和镍配合物对C-H键的活化作用及其应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

WGOS层次化语义系统模型研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

218+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

Arxiv

11+阅读 · 2019年11月4日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

微信扫码咨询专知VIP会员