首页
知乎知学堂
发现
等你来答
切换模式
登录/注册
机器学习
神经网络
深度学习(Deep Learning)
强化学习 (Reinforcement Learning)
凸优化理论(书籍)
强化学习reward陷入瓶颈有什么解决方法吗?
Hi,大家好。我最近做一个RL方面的问题,用类似DQN的思路从replay中sample然后更新value function和policy. 训练之后…
显示全部
关注者
44
被浏览
57,820
登录后你可以
不限量看优质回答
私信答主深度交流
精彩内容一键收藏
登录
查看全部 7 个回答
AI007
青大一根
关注
HC小区管理系统
发布于 2019-07-14 13:08
赞同
添加评论
分享
收藏
喜欢
收起
查看全部 7 个回答