深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

精品内容

强化学习中的注意力机制研究综述
专知会员服务
44+阅读 · 2月24日
基于深度强化学习的多无人车系统编队控制
专知会员服务
29+阅读 · 2月23日
【2023新书】深度学习科学,362页pdf
专知会员服务
104+阅读 · 2023年12月21日
基于深度强化学习的作战概念能力需求分析*
专知会员服务
60+阅读 · 2023年11月3日
【干货书】深度强化学习导论,140页pdf
专知会员服务
69+阅读 · 2023年10月21日
【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法
作战 Agent 的学习算法研究进展与发展趋势
专知会员服务
50+阅读 · 2023年10月3日
智能推演综述:博弈论视角下的战术战役兵棋与战略博弈
参考链接
父主题
微信扫码咨询专知VIP会员