Google DeepMind 是一家英国的人工智能公司。公司创建于 2010 年,最初名称是 DeepMind 科技,在 2014 年被谷歌收购。

VIP内容

无监督学习是机器学习的三个主要分支之一(以及监督学习和强化学习)。它也可以说是最不发达的分支。它的目标是通过发现和利用其隐藏结构来找到对输入数据的简约描述。据推测,与监督学习相比,这更让人联想到大脑的学习方式。此外,假设通过无监督学习发现的表示形式可以缓解深度监督和强化学习中的许多已知问题。但是,由于缺乏明确的ground-truth目标来优化,无监督学习的发展进展缓慢。在本次演讲中,DeepMind研究科学家Irina Higgins和DeepMind研究工程师Mihaela Rosca概述了无监督表示学习的历史作用以及开发和评估此类算法的困难。然后,他们将采取多学科的方法来思考什么可以做一个好的表示方法,以及为什么要这样做,然后再对无监督的表示学习的当前最新方法进行广泛的概述。

成为VIP会员查看完整内容
0
18

最新论文

We present CURL: Contrastive Unsupervised Representations for Reinforcement Learning. CURL extracts high-level features from raw pixels using contrastive learning and performs off-policy control on top of the extracted features. CURL outperforms prior pixel-based methods, both model-based and model-free, on complex tasks in the DeepMind Control Suite and Atari Games showing 1.9x and 1.6x performance gains at the 100K environment and interaction steps benchmarks respectively. On the DeepMind Control Suite, CURL is the first image-based algorithm to nearly match the sample-efficiency and performance of methods that use state-based features.

0
5
下载
预览
Top