怎么设置一个人工智能体,让它在它的世界环境里“怕死”?
关注者
14被浏览
1,340登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏
很简单,可以通过强化学习实现,因为强化学习可以自我实现探索和自我利用提升。在reward的设计中,给”死“这个状态设计很小的reward,在多次trial and error的试错之后,自然就会”怕死“。强化学习会根据一个policy的evaluation,来improve这个policy,因而,在多次探索之后,如果给与不错的reward设计,会得到很好的策略。