深度学习（Deep Learning）

强化学习 (Reinforcement Learning)

凸优化理论（书籍）

强化学习reward陷入瓶颈有什么解决方法吗？

Hi，大家好。我最近做一个RL方面的问题，用类似DQN的思路从replay中sample然后更新value function和policy. 训练之后…

关注者

44

被浏览

57,820

登录后你可以

不限量看优质回答私信答主深度交流精彩内容一键收藏

查看全部 7 个回答

HC小区管理系统

发布于 2019-07-14 13:08

查看全部 7 个回答