首页
知乎知学堂
发现
等你来答
切换模式
登录/注册
博弈论
石头剪刀布
强化学习 (Reinforcement Learning)
强化学习能解决石头剪刀布的问题吗?
强化学习对状态的价值评估想要量化,默认的前提是状态价值的比较关系可传递。那么像石头剪刀布这种相互克制的关系用强化学习解决会出现什么情况呢。
显示全部
关注者
1
被浏览
510
登录后你可以
不限量看优质回答
私信答主深度交流
精彩内容一键收藏
登录
查看全部 1 个回答
匿名用户
self play,psro什么的了解一下
发布于 2021-05-15 08:49
赞同
添加评论
分享
收藏
喜欢
收起
查看全部 1 个回答