DeepMind 开源基于 MuJoCo 物理引擎强化学习工具 Control Suite

2018 年 1 月 4 日 AI研习社 孔令双

DeepMind Control Suite 是 DeepMind 最新开源的,一套有标准化结构的持续控制任务,旨在成为强化学习 Agent 的性能基准。Control Suite 由 Python 编写,并由 MuJoCo 物理引擎驱动。

论文:

https://arxiv.org/abs/1801.00690

代码:

https://github.com/deepmind/dm_control

演示视频:


  安装和要求:

1.从 MuJoCo(http://www.mujoco.org/) 上下载 MuJoCo Pro 1.50,在安装 MuJoCo Pro 之前必须先装好 dm_control, dm_control 的安装脚本会基于 MuJoCo 的头文件生成 Python ctypes 绑定。默认情况下,dm_control会假定 MuJoCo Zip 文件将被提取到 ~/.mujoco/mjpro150 文件夹。

2.通过运行 pip install git+git://github.com/deepmind/dm_control.git 安装 dm_control Python 包,或者克隆 Github 代码库然后运行 pip install /path/to/dm_control/。在安装期间,dm_control 会在 ~/.mujoco/mjpro150/include 的步骤 1 里寻找 MuJoCo 头文件,不过该路径可通过 headers-dir 命令配置。

3.在运行时,dm_control 会要求安装 license key,详情请查看 MuJoCo license key (https://www.roboti.us/license.html)页面。默认情况下,dm_control 在 ~/.mujoco/mjkey.txt 路径寻找 MuJoCo license key。

4.如果将 license key (例如,mjkey.txt) 或 MuJoCo Pro 所提供的共享库(例如,libmujoco150.so或 libmujoco150.dylib)安装到非默认路径,需要用 MJKEY_PATH 和 MJLIB_PATH 环境变量来指定其路径。

  macOS 用户 Homebrew 额外安装说明

1.只要你是用 Homebrew 安装的 Python 解释器 (注意:不是系统默认的解释器),使用上述 pip 安装命令一般是可行的。

2.获取 OpenGL 之前,需要通过运行 brew install glfw 从 Homebrew 安装 glfw。

3.在运行之前,DYLD_LIBRARY_PATH 的环境变量要用 GLFW 库路径来更新,通过运行 export DYLD_LIBRARY_PATH=$(brew --prefix)/lib:$DYLD_LIBRARY_PATH 即可。

  Control Suite 快速入门

from dm_control import suite

# Load one task:
env = suite.load(domain_name="cartpole", task_name="swingup")

# Iterate over a task set:
for domain_name, task_name in suite.BENCHMARKING:
 env = suite.load(domain_name, task_name)

# Step through an episode and print out reward, discount and observation.
action_spec = env.action_spec()
time_step = env.reset()
while not time_step.last():
 action = np.random.uniform(action_spec.minimum,
                            action_spec.maximum,
                            size=action_spec.shape)
 time_step = env.step(action)
 print(time_step.reward, time_step.discount, time_step.observation)

AI 慕课年度学习盛典

爆款课程限时打折,优惠卡券免费领取!

精品课程 1 元秒杀,买课即送热门图书!

▼▼▼  




新人福利




关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据,教程,论文】



想了解 2017 最火新开源 AI 工具?请进入阅读原文

登录查看更多
2

相关内容

一份简明有趣的Python学习教程,42页pdf
专知会员服务
77+阅读 · 2020年6月22日
《强化学习》简介小册,24页pdf
专知会员服务
277+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
MIT新书《强化学习与最优控制》
专知会员服务
280+阅读 · 2019年10月9日
PLANET+SAC代码实现和解读
CreateAMind
3+阅读 · 2019年7月24日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
Windows开源无人机仿真工具:AirSim1.0 入门
无人机
26+阅读 · 2019年6月8日
Pupy – 全平台远程控制工具
黑白之道
43+阅读 · 2019年4月26日
A Modern Introduction to Online Learning
Arxiv
21+阅读 · 2019年12月31日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关VIP内容
相关资讯
PLANET+SAC代码实现和解读
CreateAMind
3+阅读 · 2019年7月24日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
Windows开源无人机仿真工具:AirSim1.0 入门
无人机
26+阅读 · 2019年6月8日
Pupy – 全平台远程控制工具
黑白之道
43+阅读 · 2019年4月26日
Top
微信扫码咨询专知VIP会员