首页
知乎知学堂
发现
等你来答
切换模式
登录/注册
机器学习
强化学习 (Reinforcement Learning)
深度强化学习
强化学习中的reward值分别设置为1、2、3时,会有什么区别?什么影响?
强化学习中的reward值分别设置为1、2、3时,会有什么区别?什么影响?reward分别取1或2或3时,奖励越高,agent选择这一串action的…
显示全部
关注者
9
被浏览
7,676
登录后你可以
不限量看优质回答
私信答主深度交流
精彩内容一键收藏
登录
查看全部 5 个回答
电光幻影炼金术
ENFP快乐小狗-认真分享些干货-bilibili同名
关注
你应该自己试试,实践出真知。
一般而言没有什么太大影响,具体任务可能有区别,要具体对待。
发布于 2021-05-15 09:26
赞同 1
添加评论
分享
收藏
喜欢
收起
查看全部 5 个回答