我们将归纳偏差引入到强化学习中,这种强化学习受到人类高级认知功能的启发。这些架构约束使得规划能够动态地将注意力引导到想象的未来轨迹的每个步骤中有趣的状态部分。

成为VIP会员查看完整内容
24

相关内容

前所未有:用AI控制核聚变,DeepMind再登Nature
学术头条
0+阅读 · 2022年2月17日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关资讯
前所未有:用AI控制核聚变,DeepMind再登Nature
学术头条
0+阅读 · 2022年2月17日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员