【Facebook-Yuandong Tian】在RL中为搜索和探索找到良好的表示，附71页PPT与视频 - 专知VIP

会员服务 ·

1

强化学习 · 表示学习 ·

2021 年 4 月 16 日

【Facebook-Yuandong Tian】在RL中为搜索和探索找到良好的表示，附71页PPT与视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

如何学习良好的潜在表示是现代机器学习时代的一个重要课题。对于强化学习，使用一个好的表示使决策过程更加有效。本次演讲，我将介绍我们的工作，构建基于任务的潜在操作空间，用于基于搜索的黑盒函数优化，寻找策略变更的表示，该表示支持在不完全信息协同博弈中联合策略搜索，以及不同的表示如何影响RL探索。

视频：

https://www.youtube.com/watch?v=sH4a2a0ntUA

成为VIP会员查看完整内容

18

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【Facebook】强化学习中的探索与利用，Matteo Pirotta讲解，137页ppt

专知会员服务

39+阅读 · 2021年4月8日

【MILA-唐建】学习知识图谱推理的符号逻辑规则，附视频与PPT

【MILA-唐建】学习知识图谱推理的符号逻辑规则，附视频与PPT

专知会员服务

84+阅读 · 2021年2月13日

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

【AAAI2021最佳论文】多智能体学习中的探索 - 利用

【AAAI2021最佳论文】多智能体学习中的探索 - 利用

专知会员服务

36+阅读 · 2021年2月6日

【伯克利】神经网络中的对称性与同变性，附视频与114页ppt

【伯克利】神经网络中的对称性与同变性，附视频与114页ppt

专知会员服务

25+阅读 · 2020年10月2日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

专知会员服务

168+阅读 · 2020年6月30日

【CMU-Google-斯坦福】可控行为的弱监督强化学习，Weakly-Supervised RL

【CMU-Google-斯坦福】可控行为的弱监督强化学习，Weakly-Supervised RL

专知会员服务

22+阅读 · 2020年4月8日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

NeurIPS2020最新Google《图学习与挖掘》综述教程，附312页ppt与视频

NeurIPS2020最新Google《图学习与挖掘》综述教程，附312页ppt与视频

专知

22+阅读 · 2020年12月9日

让知识来指引你：序列推荐场景中以知识为导向的强化学习模型

让知识来指引你：序列推荐场景中以知识为导向的强化学习模型

PaperWeekly

6+阅读 · 2020年6月8日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

伯克利人工智能导论课开放：视频、PPT和练习都在这 | 资源

伯克利人工智能导论课开放：视频、PPT和练习都在这 | 资源

量子位

9+阅读 · 2019年1月17日

UC伯克利Pieter Abbeel谈论强化学习-视频

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

一文读懂神经网络(附PPT、视频)

一文读懂神经网络(附PPT、视频)

数据派THU

17+阅读 · 2018年3月25日

【干货】3万字剖析强化学习在电商环境下应用

【干货】3万字剖析强化学习在电商环境下应用

新智元

3+阅读 · 2018年1月9日

【强化学习】淘宝：3万字介绍强化学习在电商环境下的若干应用与研究

【强化学习】淘宝：3万字介绍强化学习在电商环境下的若干应用与研究

产业智能官

9+阅读 · 2018年1月8日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

Self-Paced Context Evaluation for Contextual Reinforcement Learning

Arxiv

0+阅读 · 2021年6月9日

Targeted Active Learning for Bayesian Decision-Making

Arxiv

0+阅读 · 2021年6月8日

Expressivity of Emergent Language is a Trade-off between Contextual Complexity and Unpredictability

Arxiv

0+阅读 · 2021年6月7日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation

Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation

Arxiv

9+阅读 · 2018年11月25日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Learning Unsupervised Learning Rules

Arxiv

7+阅读 · 2018年5月23日

A Study on Overfitting in Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年4月20日

Pay More Attention - Neural Architectures for Question-Answering

Arxiv

5+阅读 · 2018年3月25日

Composition of PPT Maps

Arxiv

6+阅读 · 2017年12月7日

VIP会员

相关主题

相关VIP内容

【Facebook】强化学习中的探索与利用，Matteo Pirotta讲解，137页ppt

专知会员服务

39+阅读 · 2021年4月8日

【MILA-唐建】学习知识图谱推理的符号逻辑规则，附视频与PPT

【MILA-唐建】学习知识图谱推理的符号逻辑规则，附视频与PPT

专知会员服务

84+阅读 · 2021年2月13日

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

【AAAI2021最佳论文】多智能体学习中的探索 - 利用

【AAAI2021最佳论文】多智能体学习中的探索 - 利用

专知会员服务

36+阅读 · 2021年2月6日

【伯克利】神经网络中的对称性与同变性，附视频与114页ppt

【伯克利】神经网络中的对称性与同变性，附视频与114页ppt

专知会员服务

25+阅读 · 2020年10月2日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

专知会员服务

168+阅读 · 2020年6月30日

【CMU-Google-斯坦福】可控行为的弱监督强化学习，Weakly-Supervised RL

【CMU-Google-斯坦福】可控行为的弱监督强化学习，Weakly-Supervised RL

专知会员服务

22+阅读 · 2020年4月8日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

NeurIPS2020最新Google《图学习与挖掘》综述教程，附312页ppt与视频

NeurIPS2020最新Google《图学习与挖掘》综述教程，附312页ppt与视频

专知

22+阅读 · 2020年12月9日

让知识来指引你：序列推荐场景中以知识为导向的强化学习模型

让知识来指引你：序列推荐场景中以知识为导向的强化学习模型

PaperWeekly

6+阅读 · 2020年6月8日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

伯克利人工智能导论课开放：视频、PPT和练习都在这 | 资源

伯克利人工智能导论课开放：视频、PPT和练习都在这 | 资源

量子位

9+阅读 · 2019年1月17日

UC伯克利Pieter Abbeel谈论强化学习-视频

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

一文读懂神经网络(附PPT、视频)

一文读懂神经网络(附PPT、视频)

数据派THU

17+阅读 · 2018年3月25日

【干货】3万字剖析强化学习在电商环境下应用

【干货】3万字剖析强化学习在电商环境下应用

新智元

3+阅读 · 2018年1月9日

【强化学习】淘宝：3万字介绍强化学习在电商环境下的若干应用与研究

【强化学习】淘宝：3万字介绍强化学习在电商环境下的若干应用与研究

产业智能官

9+阅读 · 2018年1月8日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Self-Paced Context Evaluation for Contextual Reinforcement Learning

Arxiv

0+阅读 · 2021年6月9日

Targeted Active Learning for Bayesian Decision-Making

Arxiv

0+阅读 · 2021年6月8日

Expressivity of Emergent Language is a Trade-off between Contextual Complexity and Unpredictability

Arxiv

0+阅读 · 2021年6月7日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation

Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation

Arxiv

9+阅读 · 2018年11月25日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Learning Unsupervised Learning Rules

Arxiv

7+阅读 · 2018年5月23日

A Study on Overfitting in Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年4月20日

Pay More Attention - Neural Architectures for Question-Answering

Arxiv

5+阅读 · 2018年3月25日

Composition of PPT Maps

Arxiv

6+阅读 · 2017年12月7日

微信扫码咨询专知VIP会员