【NeurIPS2022】分布式自适应元强化学习

2022 年 10 月 8 日 专知


元强化学习算法提供了一种数据驱动的方法来获得快速适应许多具有不同奖励或动态功能的任务的策略。然而,学习到的元策略通常只在它们被训练的确切任务分布上有效,并在测试时间奖励的分布变化或过渡动态的存在下很困难。本文为元强化学习算法开发了一个框架,能够在任务空间的测试时分布变化下表现适当。我们的框架以一种适应分布鲁棒性的方法为中心,它训练一组元策略对不同级别的分布转移具有鲁棒性。当在可能发生变化的任务测试时分布上进行评估时,这使我们能够选择具有最适当鲁棒性水平的元策略,并使用它来执行快速自适应。我们正式地展示了我们的框架如何允许改进分布位移下的遗憾,并实证地展示了它在广泛分布位移下的模拟机器人问题上的有效性。


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DAMR” 就可以获取【NeurIPS2022】分布式自适应元强化学习》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
3

相关内容

Meta RL(Meta Reinforcement Learning)是Meta Learning应用到Reinforcement Learning的一个研究方向,核心的想法就是希望AI在学习大量的RL任务中获取足够的先验知识Prior Knowledge然后在面对新的RL任务时能够 学的更快,学的更好,能够自适应新环境!
【NeurIPS2022】SparCL:边缘稀疏持续学习
专知会员服务
23+阅读 · 2022年9月22日
【牛津大学博士论文】元强化学习的快速自适应,217页pdf
【ICML2022】Transformer是元强化学习器
专知会员服务
50+阅读 · 2022年6月15日
【NeurIPS2021】视觉语言导航的课程学习
专知会员服务
23+阅读 · 2021年11月26日
【NeurIPS2021】序一致因果图的多任务学习
专知会员服务
19+阅读 · 2021年11月7日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
26+阅读 · 2021年5月24日
【NeurIPS2022】具有自适应读出的图神经网络
【NeurIPS2022】SparCL:边缘稀疏持续学习
专知
2+阅读 · 2022年9月22日
《元强化学习》最新,70页ppt
专知
2+阅读 · 2022年9月16日
【NeurIPS2021】视觉语言导航的课程学习
专知
1+阅读 · 2021年11月26日
【NeurIPS2021】任务导向的无监督域自适应
专知
1+阅读 · 2021年11月20日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2009年12月31日
国家自然科学基金
42+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
VIP会员
相关VIP内容
【NeurIPS2022】SparCL:边缘稀疏持续学习
专知会员服务
23+阅读 · 2022年9月22日
【牛津大学博士论文】元强化学习的快速自适应,217页pdf
【ICML2022】Transformer是元强化学习器
专知会员服务
50+阅读 · 2022年6月15日
【NeurIPS2021】视觉语言导航的课程学习
专知会员服务
23+阅读 · 2021年11月26日
【NeurIPS2021】序一致因果图的多任务学习
专知会员服务
19+阅读 · 2021年11月7日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
26+阅读 · 2021年5月24日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2009年12月31日
国家自然科学基金
42+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员