UNREAL(DRL算法),无监督强化与辅助学习,是Google DeepMind在A3C算法的改进,在进行特定DRL任务训练过程中,增加了辅助任务,即辅助任务学习,相当于启发性知识,以此来提高强化学习模型的性能。这种辅助任务大致分两种,一种是辅助控制,另一种是辅助反馈。

精品内容

没有数据了, 换个别的吧!
参考链接
父主题
微信扫码咨询专知VIP会员