这个高仿真框架AI2-THOR，想让让强化学习快速走进现实世界

2017 年 12 月 16 日 量子位 专注报道AI

夏乙编译整理
量子位出品 | 公众号 QbitAI

AlphaGo的节节胜利，向人们展示了强化学习的强大能力。但要是想让这种方法作用于现实世界，指挥机器人完成开门、拿东西、放东西等等对人类来说轻而易举的任务，还需要解决一个问题：

一个强化学习模型要经历多次试错过程才能收敛，可是让它在现实世界中一次一次地试错显然有些不切实际。

为了填平这道虚拟和现实世界中的鸿沟，一个名叫AI2-THOR的新框架产生了。

AI2-THOR是由艾伦人工智能研究所（AI2）、斯坦福大学、卡耐基梅隆大学、华盛顿大学、南加州大学合作完成的。它为人工智能Agent提供了一个室内装修效果图画风的世界，高度仿真，Agent可以和里面的各种家具家电交互——比如说打开冰箱、推倒椅子、把电脑放在桌子上等等。

为了让Agent与场景的交互尽可能接近真实，AI2-THOR除了包含表面上能看到的高质量3D场景之外，背后还有Unity 3D引擎，能让其中的物体遵循现实世界的物理规则来运动，也就是让交互动作尽可能真实。

另外，AI2-THOR还提供Python API。

与同类框架相比，Agent可以操作场景中的物体，是AI2-THOR的一大亮点。它的真实性和对物理规则的整合，也是很少有框架具备的。

在提出这个框架的同时，这些研究人员还为了提高强化学习模型对新目标的泛化能力，提出了一个以当前状态和目标的函数为策略的演员-评论家模型。

这二者结合起来，达到了比最先进的深度强化学习方法更快的收敛速度，还能够泛化到各种目标和场景。

在模拟场景中训练的模型在经过少量微调后，甚至能泛化到真实的机器人活动场景。另外，他们的模型可以端到端地训练，不需要特征工程、图像之间的特征匹配和环境的3D重建。

项目主页：

http://ai2thor.allenai.org/

开源代码：

https://github.com/allenai/ai2thor

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

122+阅读 · 2020年5月18日

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

专知会员服务

10+阅读 · 2020年3月27日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

185+阅读 · 2020年1月17日

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

专知会员服务

104+阅读 · 2019年10月22日

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

快速上手深度强化学习？学会TensorForce就够了

新智元

6+阅读 · 2019年3月27日

加州伯克利大学：自动驾驶中虚拟到现实的强化学习｜厚势汽车

人工智能学家

5+阅读 · 2018年10月14日

【泡泡一分钟】基于深度增强学习的目标驱动式室内场景视觉导航（ICRA-21）

泡泡机器人SLAM

6+阅读 · 2018年1月11日

谷歌发布TensorFlowLite，用半监督跨平台快速训练ML模型！

全球人工智能

5+阅读 · 2017年11月15日

Unsupervised Cross-lingual Representation Learning at Scale

Arxiv

5+阅读 · 2019年11月5日

Transfer Adaptation Learning: A Decade Survey

Arxiv

37+阅读 · 2019年3月12日

Knowledge Representation Learning: A Quantitative Review

Arxiv

28+阅读 · 2018年12月28日

Energy-Based Hindsight Experience Prioritization

Arxiv

3+阅读 · 2018年10月8日

Do deep reinforcement learning agents model intentions?

Arxiv

5+阅读 · 2018年5月21日

VIP会员