基于多智能体强化学习的多机器人系统研究 - 专知基金

会员服务 ·

8

强化学习 · 多智能系统 · 决策策略 ·

2009 年 12 月 31 日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于多智能体强化学习的多机器人系统研究

项目编号： No.60905054

项目类型： 青年科学基金项目

立项/批准年度： 2010

项目学科： 金属学与金属工艺

项目作者： 段勇

作者单位： 沈阳工业大学

项目金额： 19万元

中文摘要： 多机器人系统的协调以及如何使群体机器人能够适应其任务环境的动态变化而自动地规划其任务处理行为一直是多机器人系统研究的主要问题，而强化学习方法能够使机器人在同环境的交互过程中学习决策能力和行为能力。基于此，本项目就以下内容展开研究工作：（1）研究强化学习状态空间量化方法，以解决强化学习的维数灾难问题；（2）研究利用函数逼近方法的非线性映射能力来实现强化学习的状态空间到动作空间的映射，以解决强化学习大规模、连续的状态空间和动作空间问题；（3）研究智能体预测方法和学习策略共享机制，以解决非马尔可夫过程的多智能体强化学习问题（4）研究强化学习在机器人足球比赛这种典型的多机器人系统中的应用，建立机器人足球决策系统的分级学习结构，使用研究的多智能体强化学习方法来实现各级任务的学习。因此，本项目的研究能够提高机器人的智能水平、自和学习能力，对实现多智能体之间的分工与协作有着重要的理论意义和实际价值。

中文关键词： 强化学习；多智能系统；机器人足球比赛；决策策略；

英文摘要：

英文关键词： Reinforcement learning；Multi-agent system；Robot soccer；Decision-making strategy；

成为VIP会员查看完整内容

48

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

146+阅读 · 2022年4月5日

【多智能体学习】DeepMind教程，231页PPT

【多智能体学习】DeepMind教程，231页PPT

专知会员服务

128+阅读 · 2022年3月25日

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

专知会员服务

83+阅读 · 2021年11月11日

【ICML2021】连续结构非平稳性中的深度强化学习

专知会员服务

15+阅读 · 2021年9月25日

【SIGIR2021教程】基于强化学习的信息检索

专知会员服务

28+阅读 · 2021年7月20日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

64+阅读 · 2021年4月22日

强化学习的自动驾驶控制技术研究进展

专知会员服务

139+阅读 · 2021年2月17日

【AAAI2021】Lipschitz终身强化学习

专知会员服务

31+阅读 · 2020年12月14日

基于深度强化学习的组合优化研究进展

专知会员服务

88+阅读 · 2020年12月11日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

47+阅读 · 2020年10月26日

我的天，强化学习还能用在自动驾驶领域？

我的天，强化学习还能用在自动驾驶领域？

夕小瑶的卖萌屋

1+阅读 · 2022年3月24日

自动驾驶前沿综述：基于深度强化学习的自动驾驶算法

自动驾驶前沿综述：基于深度强化学习的自动驾驶算法

PaperWeekly

5+阅读 · 2022年3月15日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

AI前线

8+阅读 · 2021年12月13日

基于自监督的可逆性强化学习方法

基于自监督的可逆性强化学习方法

AI前线

4+阅读 · 2021年12月3日

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

专知

9+阅读 · 2021年11月11日

去中心化多智能体导航的基于模型的强化学习 (RL)

去中心化多智能体导航的基于模型的强化学习 (RL)

TensorFlow

13+阅读 · 2021年6月24日

基于深度强化学习的机器人运动控制研究进展

基于深度强化学习的机器人运动控制研究进展

专知

3+阅读 · 2021年4月22日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

37+阅读 · 2020年3月15日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

时间/事件混合驱动环境下的分布式预测控制设计与性能分析

国家自然科学基金

1+阅读 · 2012年12月31日

基于学习人类策略的动态稳定系统控制器切换方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

脑意图受限映射下的四足机器人脑机行为交互机理与协作控制研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于行为决策理论的隐性目标决策模型与方法研究

国家自然科学基金

5+阅读 · 2012年12月31日

基于事件的强化学习及其在群机器人优化控制中的应用

国家自然科学基金

3+阅读 · 2012年12月31日

基于生物感知和反射机理的仿人机器人步行运动控制与环境适应性研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

16+阅读 · 2009年12月31日

基于智能行为构架的双足机器人步态控制方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

A sojourn-based approach to semi-Markov Reinforcement Learning

Arxiv

0+阅读 · 2022年4月20日

Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning

Arxiv

1+阅读 · 2022年4月20日

Memory-Constrained Policy Optimization

Arxiv

0+阅读 · 2022年4月20日

Two-Stream Graph Convolutional Network for Intra-oral Scanner Image Segmentation

Arxiv

0+阅读 · 2022年4月19日

Deep Reinforcement Learning for Practical Phase Shift Optimization in RIS-aided MISO URLLC Systems

Arxiv

0+阅读 · 2022年4月19日

IIFNet: A Fusion based Intelligent Service for Noisy Preamble Detection in 6G

Arxiv

0+阅读 · 2022年4月16日

Knowledge Embedding Based Graph Convolutional Network

Knowledge Embedding Based Graph Convolutional Network

Arxiv

24+阅读 · 2021年4月23日

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Arxiv

15+阅读 · 2020年12月15日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

多智能系统

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军特种作战条令》最新102页

《洛克希德SR-71“黑鸟”侦察机动力系统》21页slides

美空军作战实验室通过人工智能和指挥控制技术创新推进杀伤链

《指挥控制能力分析方法论》最新报告

相关VIP内容

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

146+阅读 · 2022年4月5日

【多智能体学习】DeepMind教程，231页PPT

【多智能体学习】DeepMind教程，231页PPT

专知会员服务

128+阅读 · 2022年3月25日

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

专知会员服务

83+阅读 · 2021年11月11日

【ICML2021】连续结构非平稳性中的深度强化学习

专知会员服务

15+阅读 · 2021年9月25日

【SIGIR2021教程】基于强化学习的信息检索

专知会员服务

28+阅读 · 2021年7月20日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

64+阅读 · 2021年4月22日

强化学习的自动驾驶控制技术研究进展

专知会员服务

139+阅读 · 2021年2月17日

【AAAI2021】Lipschitz终身强化学习

专知会员服务

31+阅读 · 2020年12月14日

基于深度强化学习的组合优化研究进展

专知会员服务

88+阅读 · 2020年12月11日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

47+阅读 · 2020年10月26日

相关资讯

我的天，强化学习还能用在自动驾驶领域？

我的天，强化学习还能用在自动驾驶领域？

夕小瑶的卖萌屋

1+阅读 · 2022年3月24日

自动驾驶前沿综述：基于深度强化学习的自动驾驶算法

自动驾驶前沿综述：基于深度强化学习的自动驾驶算法

PaperWeekly

5+阅读 · 2022年3月15日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

AI前线

8+阅读 · 2021年12月13日

基于自监督的可逆性强化学习方法

基于自监督的可逆性强化学习方法

AI前线

4+阅读 · 2021年12月3日

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

专知

9+阅读 · 2021年11月11日

去中心化多智能体导航的基于模型的强化学习 (RL)

去中心化多智能体导航的基于模型的强化学习 (RL)

TensorFlow

13+阅读 · 2021年6月24日

基于深度强化学习的机器人运动控制研究进展

基于深度强化学习的机器人运动控制研究进展

专知

3+阅读 · 2021年4月22日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

37+阅读 · 2020年3月15日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关基金

时间/事件混合驱动环境下的分布式预测控制设计与性能分析

国家自然科学基金

1+阅读 · 2012年12月31日

基于学习人类策略的动态稳定系统控制器切换方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

脑意图受限映射下的四足机器人脑机行为交互机理与协作控制研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于行为决策理论的隐性目标决策模型与方法研究

国家自然科学基金

5+阅读 · 2012年12月31日

基于事件的强化学习及其在群机器人优化控制中的应用

国家自然科学基金

3+阅读 · 2012年12月31日

基于生物感知和反射机理的仿人机器人步行运动控制与环境适应性研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

16+阅读 · 2009年12月31日

基于智能行为构架的双足机器人步态控制方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

A sojourn-based approach to semi-Markov Reinforcement Learning

Arxiv

0+阅读 · 2022年4月20日

Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning

Arxiv

1+阅读 · 2022年4月20日

Memory-Constrained Policy Optimization

Arxiv

0+阅读 · 2022年4月20日

Two-Stream Graph Convolutional Network for Intra-oral Scanner Image Segmentation

Arxiv

0+阅读 · 2022年4月19日

Deep Reinforcement Learning for Practical Phase Shift Optimization in RIS-aided MISO URLLC Systems

Arxiv

0+阅读 · 2022年4月19日

IIFNet: A Fusion based Intelligent Service for Noisy Preamble Detection in 6G

Arxiv

0+阅读 · 2022年4月16日

Knowledge Embedding Based Graph Convolutional Network

Knowledge Embedding Based Graph Convolutional Network

Arxiv

24+阅读 · 2021年4月23日

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Arxiv

15+阅读 · 2020年12月15日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

微信扫码咨询专知VIP会员