生成式基座大模型正在引发人工智能领域的重大变革,在自然语言处理、多模态理解与内容合成等任务展现通用能力。大模型部署于云侧提供通用智能服务,但面临时延大、个性化不足等关键挑战,小模型部署于端侧捕捉个性化场景数据,但存在泛化性不足的难题。大小模型端云协同技术旨在结合大模型通用能力和小模型专用能力,以协同交互方式学习演化进而赋能下游垂直行业场景。本文以大语言模型和多模态大模型为代表,梳理生成式基座大模型的主流架构、典型预训练技术和适配微调等方法,介绍在大模型背景下模型剪枝、模型量化和知识蒸馏等大模型小型化关键技术的发展历史和研究近况,依据模型间协作目的及协同原理异同,提出大小模型协同训练、协同推理和协同规划的协同进化分类方法,概述端云模型双向蒸馏、模块化设计和生成式智能体等系列代表性新技术、新思路。总体而言,本文从生成式基座大模型、大模型小型化技术和大小模型端云协同方式3个方面探讨大小模型协同进化的国际和国内发展现状,对比优势和差距,并从应用前景、模型架构设计、垂直领域模型融合、个性化和安全可信挑战等层面分析基座赋能发展趋势。

成为VIP会员查看完整内容
19

相关内容

多智能体协作机制:大语言模型综述
专知会员服务
77+阅读 · 1月14日
无人机边缘计算: 架构、多址接入与计算卸载
专知会员服务
35+阅读 · 2024年9月16日
专知会员服务
34+阅读 · 2021年7月25日
专知会员服务
74+阅读 · 2021年7月21日
面向多智能体博弈对抗的对手建模框架
专知
17+阅读 · 2022年9月28日
数据受限条件下的多模态处理技术综述
专知
21+阅读 · 2022年7月16日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
无人机集群、蜂群与蜂群算法
无人机
94+阅读 · 2018年9月25日
深度学习之CNN简介
Python技术博文
20+阅读 · 2018年1月10日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
494+阅读 · 2023年3月31日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
多智能体协作机制:大语言模型综述
专知会员服务
77+阅读 · 1月14日
无人机边缘计算: 架构、多址接入与计算卸载
专知会员服务
35+阅读 · 2024年9月16日
专知会员服务
34+阅读 · 2021年7月25日
专知会员服务
74+阅读 · 2021年7月21日
相关资讯
面向多智能体博弈对抗的对手建模框架
专知
17+阅读 · 2022年9月28日
数据受限条件下的多模态处理技术综述
专知
21+阅读 · 2022年7月16日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
无人机集群、蜂群与蜂群算法
无人机
94+阅读 · 2018年9月25日
深度学习之CNN简介
Python技术博文
20+阅读 · 2018年1月10日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
相关论文
A Survey of Large Language Models
Arxiv
494+阅读 · 2023年3月31日
Arxiv
25+阅读 · 2023年3月17日
微信扫码咨询专知VIP会员