【CVPR2021】面向机器人的预训练模型-一种通用方法，伯克利Pieter Abbeel教授，附slides与视频

嘉宾：Pieter Abbeel ，加州大学伯克利分校机器人学习实验室主任，人工智能实验室联合主任、covariant.ai 和 Gradescope 联合创始人

在这次演讲中，我将分享我对如何为机器人实现大型预训练神经网络的想法，就像GPT-x/BERT等预训练模型在NLP中被标准使用的方式一样。我列出了我们如何在无监督表征学习、无监督(无奖励)强化学习(RL)预训练、人在循环中的RL和少样本模仿学习等方面取得实质性的研究进展。

成为VIP会员查看完整内容

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【伯克利-Pieter Abbeel】深度强化学习基础，附slides与视频

专知会员服务

29+阅读 · 2021年8月26日

【DeepMind】多模态预训练模型概述，37页ppt

专知会员服务

95+阅读 · 2021年7月2日

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

专知会员服务

33+阅读 · 2019年12月13日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知会员服务

34+阅读 · 2019年11月26日

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

专知会员服务

29+阅读 · 2019年11月2日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

AI研习社

8+阅读 · 2019年6月20日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

新智元

13+阅读 · 2019年1月2日

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

Cross-domain Imitation from Observations

Arxiv

8+阅读 · 2021年5月20日

DialoGPT: Large-Scale Generative Pre-training for Conversational Response Generation

Arxiv

5+阅读 · 2019年11月1日

gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo

Arxiv

7+阅读 · 2019年3月14日

Parameter Space Noise for Exploration

Arxiv

3+阅读 · 2018年1月31日

Dr.VAE: Drug Response Variational Autoencoder

Arxiv

3+阅读 · 2017年7月6日

相关内容

知识荟萃

更多