谷歌开源强化学习框架 Dopamine

2018 年 8 月 28 日 云头条

强化学习是一种AI技术,使用奖励(或惩罚)机制来驱动代理(agent)实现特定的目标。经过强化学习训练的系统击败了Alpha Go世界冠军,并在Valve开发的热门游戏《刀塔2》(Dota 2)中击败了人类。强化学习还是谷歌子公司DeepMind的深度Q网络(DQN)的核心组成部分,深度Q网络可以在多个worker节点当中分配学习任务,以实现某个具体的目标,比如说在Atari 2600游戏中获得“超人类”性能。可问题在于,强化学习框架需要时间才能达成目标,往往缺乏灵活性,而且并不总是很稳定。


这就是为什么现在谷歌提出了一种替代方案:基于其机器学习库TensorFlow的开源强化学习框架。从今天开始,该框架可以从Github获得(https://github.com/google/dopamine/tree/master/docs#downloads)。


谷歌Brain团队的两名研究人员巴勃罗•塞缪尔•卡斯特罗(Pablo Samuel Castro)和马克•G•贝勒马尔(Marc G. Bellemare)在一篇博文中写道:“该平台受到大脑中奖赏激励行为的主要部分之一的启发,体现了神经科学与强化学习研究之间紧密的历史联系,旨在能够实现有望带来重大发现的那种纯理论研究。这次发布的内容还包括一组阐明如何使用我们框架的colab,colab是谷歌用于数据科学的一种内部研究工具。”


他们和谷歌Brain团队开发了强化学习框架,恪守三大原则:灵活性、稳定性和重现性。


该图直观地显示了使用强化学习训练的AI代理(图片来源:谷歌)


为此,它包含一套紧凑的文档完备的代码(15个Python文件),专注于Arcade Learning Environment(街机学习环境)――这个平台用于用视频游戏来评估AI技术,还包含四种不同的机器学习模型:上述的DQN、C51、简化版本的Rainbow代理以及隐式分位数网络(Implicit Quantile Network)。为了确保重现性,除了代码外还附有面向街机学习环境支持的60款游戏的完整测试覆盖范围和训练数据(采用JSON和Python pickle格式),并遵循结果实现标准化以用于经验评估方面的最佳实践。


除了发布增强学习框架外,谷歌还推出了一个网站,允许广大开发人员迅速直观地显示多个代理的训练运行。谷歌还提供经过训练的模型、原始统计日志和TensorFlow事件文件,以便用TensorBoard来绘图,而TensorBoard是这家总部位于芒廷维尤的公司为TensorFlow程序开发的可视化工具套件。


贝勒马尔和卡斯特罗写道:“我们希望,我们的框架具有的灵活性和易用性将造福广大研究人员,便于他们尝试新的想法,包括渐进和激进的新想法。我们已经积极地将它用于我们的研究,发现它让我们能够灵活地快速迭代许多想法。我们很高兴看到更广大的社区能够从中得益。”


登录查看更多
1

相关内容

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
要替代 TensorFlow?谷歌开源机器学习库 JAX
新智元
3+阅读 · 2018年12月14日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
GitHub上12月份最热门开源项目
程序猿
4+阅读 · 2018年1月9日
28 款 GitHub 最流行的开源机器学习项目(附地址)
七月在线实验室
4+阅读 · 2017年12月18日
资源 | GitHub上的五大开源机器学习项目
机器之心
9+阅读 · 2017年11月9日
详解TensorForce: 基于TensorFlow建立强化学习API
机械鸡
5+阅读 · 2017年7月22日
Learning to See Through Obstructions
Arxiv
7+阅读 · 2020年4月2日
Arxiv
13+阅读 · 2019年11月14日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
8+阅读 · 2018年5月21日
Arxiv
4+阅读 · 2018年3月19日
VIP会员
相关VIP内容
相关资讯
要替代 TensorFlow?谷歌开源机器学习库 JAX
新智元
3+阅读 · 2018年12月14日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
GitHub上12月份最热门开源项目
程序猿
4+阅读 · 2018年1月9日
28 款 GitHub 最流行的开源机器学习项目(附地址)
七月在线实验室
4+阅读 · 2017年12月18日
资源 | GitHub上的五大开源机器学习项目
机器之心
9+阅读 · 2017年11月9日
详解TensorForce: 基于TensorFlow建立强化学习API
机械鸡
5+阅读 · 2017年7月22日
Top
微信扫码咨询专知VIP会员