Despite recent advancements of fine-tuning large language models (LLMs) to facilitate agent tasks, parameter-efficient fine-tuning (PEFT) methodologies for agent remain largely unexplored. In this paper, we introduce three key strategies for PEFT in agent tasks: 1) Inspired by the increasingly dominant Reason+Action paradigm, we first decompose the capabilities necessary for the agent tasks into three distinct roles: reasoner, executor, and summarizer. The reasoner is responsible for comprehending the user's query and determining the next role based on the execution trajectory. The executor is tasked with identifying the appropriate functions and parameters to invoke. The summarizer conveys the distilled information from conversations back to the user. 2) We then propose the Mixture-of-Roles (MoR) framework, which comprises three specialized Low-Rank Adaptation (LoRA) groups, each designated to fulfill a distinct role. By focusing on their respective specialized capabilities and engaging in collaborative interactions, these LoRAs collectively accomplish the agent task. 3) To effectively fine-tune the framework, we develop a multi-role data generation pipeline based on publicly available datasets, incorporating role-specific content completion and reliability verification. We conduct extensive experiments and thorough ablation studies on various LLMs and agent benchmarks, demonstrating the effectiveness of the proposed method. This project is publicly available at https://mor-agent.github.io.


翻译:尽管近年来通过微调大型语言模型(LLM)来促进智能体任务取得了显著进展,但面向智能体的参数高效微调(PEFT)方法仍鲜有探索。本文针对智能体任务提出了三种关键的PEFT策略:1)受日益占据主导地位的“推理+行动”范式启发,我们首先将智能体任务所需的能力分解为三个独立角色:推理器、执行器和总结器。推理器负责理解用户查询,并根据执行轨迹决定下一个角色;执行器负责识别需调用的合适函数及其参数;总结器则将对话中提炼的信息传达给用户。2)我们进而提出了角色混合(Mixture-of-Roles, MoR)框架,该框架包含三个专用的低秩适配(LoRA)组,每组对应一个特定角色。这些LoRA模块通过专注于各自的专项能力并进行协同交互,共同完成智能体任务。3)为有效微调该框架,我们基于公开数据集开发了一个多角色数据生成流程,其中融合了角色特定的内容补全与可靠性验证。我们在多种LLM和智能体基准测试上进行了大量实验与详尽的消融研究,结果验证了所提方法的有效性。本项目已公开于 https://mor-agent.github.io。

0
下载
关闭预览

相关内容

144页ppt《扩散模型》,Google DeepMind Sander Dieleman
专知会员服务
48+阅读 · 11月21日
DeepSeek模型综述:V1 V2 V3 R1-Zero
专知会员服务
116+阅读 · 2月11日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
NLP(自然语言处理)扫盲
大数据和云计算技术
20+阅读 · 2017年7月9日
NLP自然语言处理(二)——基础文本分析
乐享数据DataScientists
12+阅读 · 2017年2月7日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
VIP会员
相关资讯
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
NLP(自然语言处理)扫盲
大数据和云计算技术
20+阅读 · 2017年7月9日
NLP自然语言处理(二)——基础文本分析
乐享数据DataScientists
12+阅读 · 2017年2月7日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员