用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频 - 专知VIP

会员服务 ·

18

Transformer · 超参数优化 · DeepMind · Yutian Chen ·

2023 年 3 月 12 日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

基于先验实验的元学习超参数优化(HPO)算法是提高分布相似目标函数优化效率的有效方法。然而，现有的方法仅限于从共享一组超参数的实验中学习。本文提出OptFormer，第一个基于文本的Transformer HPO框架，在对来自外界的大量调优数据进行训练时，提供了一个通用的端到端接口，用于联合学习策略和功能预测。实验结果表明，OptFormer可以模拟至少7种不同的HPO算法，这些算法可以通过其功能不确定性估计进一步改进。与高斯过程相比，OptFormer还学习了超参数响应函数的鲁棒先验分布，从而可以提供更准确和更好的校准预测。本文工作为未来将基于transformer的模型训练为通用HPO优化器铺平了道路。

Yutian Chen博士是DeepMind的Staff研究科学家。他在加州大学欧文分校(University of California, Irvine)获得机器学习博士学位，后来在剑桥大学(University of Cambridge)担任研究助理(博士后)，然后加入DeepMind。于田参与了AlphaGo和AlphaGo Zero项目，开发了击败世界冠军的围棋AI程序。AlphaGo项目被《新科学家》杂志评为2010年代的十大发现之一。Yutian在多个机器学习领域进行了研究，包括贝叶斯方法、离线强化学习、生成模型和应用于游戏AI、计算机视觉和文本到语音的元学习。Yutian还担任多个学术会议和期刊的评审员和区域主席。

成为VIP会员查看完整内容

39

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

不确定性决策学习，普林斯顿Bartolomeo Stellato讲授，附Slides与视频

不确定性决策学习，普林斯顿Bartolomeo Stellato讲授，附Slides与视频

专知会员服务

49+阅读 · 2023年3月6日

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

专知会员服务

26+阅读 · 2022年10月12日

【CVPR2022】好玩有趣的新成果：GAN监督学习实现密集视觉对齐（代码开源，附slides，伯克利、CMU、MIT等联合发表）

【CVPR2022】好玩有趣的新成果：GAN监督学习实现密集视觉对齐（代码开源，附slides，伯克利、CMU、MIT等联合发表）

专知会员服务

30+阅读 · 2022年3月16日

【CVPR2021】面向机器人的预训练模型-一种通用方法，伯克利Pieter Abbeel教授，附slides与视频

专知会员服务

29+阅读 · 2021年6月28日

【ST2020硬核课】深度神经网络，57页ppt

【ST2020硬核课】深度神经网络，57页ppt

专知会员服务

48+阅读 · 2020年8月19日

(ICML 2020 Tutorial)贝叶斯深度学习与概率模型构建，134页ppt

(ICML 2020 Tutorial)贝叶斯深度学习与概率模型构建，134页ppt

专知会员服务

91+阅读 · 2020年7月30日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

246+阅读 · 2020年6月20日

【元学习 | ICASSP2020提交论文】学习低资源语音识别，国立台湾大学 | 李宏毅

【元学习 | ICASSP2020提交论文】学习低资源语音识别，国立台湾大学 | 李宏毅

专知会员服务

57+阅读 · 2019年11月21日

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

专知会员服务

27+阅读 · 2019年11月21日

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

专知

0+阅读 · 2022年10月12日

什么是因果深度学习？DeepMind最新ICML2022《因果性与深度学习:协同、挑战和未来》教程，183页ppt详述因果DL

什么是因果深度学习？DeepMind最新ICML2022《因果性与深度学习:协同、挑战和未来》教程，183页ppt详述因果DL

专知

9+阅读 · 2022年7月21日

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

专知

19+阅读 · 2022年3月7日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知

21+阅读 · 2021年10月25日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

专知

21+阅读 · 2020年2月5日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

新智元

13+阅读 · 2019年1月2日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

基于自适应特征学习和表观建模的目标跟踪算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于三维视频多视觉任务协同分析研究

国家自然科学基金

0+阅读 · 2013年12月31日

带跳扩散模型的非参数统计推断研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于单元重用的海量DVE场景的渐进式对等网络传输关键技术

国家自然科学基金

0+阅读 · 2012年12月31日

非参数变换模型的统计推断

国家自然科学基金

0+阅读 · 2012年12月31日

医学图像的高容量及鲁棒可逆水印的研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于混合式学习分类器的协作多机器人系统的调度控制方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

Beta-arrestins 在突触可塑性和学习记忆中的作用研究

国家自然科学基金

0+阅读 · 2008年12月31日

基于超分辨率技术的视频重构与编码研究

国家自然科学基金

1+阅读 · 2008年12月31日

Carbon-Intelligent Global Routing in Path-Aware Networks

Arxiv

0+阅读 · 2023年5月1日

Meta Self-Refinement for Robust Learning with Weak Supervision

Arxiv

1+阅读 · 2023年4月30日

ReLBOT: A Transfer Learning Approach to Minimize Reinforcement Learning Risks in Smart Buildings

Arxiv

0+阅读 · 2023年4月30日

NVIDIA FLARE: Federated Learning from Simulation to Real-World

Arxiv

0+阅读 · 2023年4月28日

Adversarial Policy Optimization in Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年4月27日

Multimodal Deep Learning

Arxiv

28+阅读 · 2023年1月12日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

Poolingformer: Long Document Modeling with Pooling Attention

Arxiv

14+阅读 · 2021年5月10日

Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy

Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy

Arxiv

42+阅读 · 2020年12月21日

Adversarial Transfer Learning

Adversarial Transfer Learning

Arxiv

12+阅读 · 2018年12月6日

VIP会员

相关主题

超参数优化

相关VIP内容

不确定性决策学习，普林斯顿Bartolomeo Stellato讲授，附Slides与视频

不确定性决策学习，普林斯顿Bartolomeo Stellato讲授，附Slides与视频

专知会员服务

49+阅读 · 2023年3月6日

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

专知会员服务

26+阅读 · 2022年10月12日

【CVPR2022】好玩有趣的新成果：GAN监督学习实现密集视觉对齐（代码开源，附slides，伯克利、CMU、MIT等联合发表）

【CVPR2022】好玩有趣的新成果：GAN监督学习实现密集视觉对齐（代码开源，附slides，伯克利、CMU、MIT等联合发表）

专知会员服务

30+阅读 · 2022年3月16日

【CVPR2021】面向机器人的预训练模型-一种通用方法，伯克利Pieter Abbeel教授，附slides与视频

专知会员服务

29+阅读 · 2021年6月28日

【ST2020硬核课】深度神经网络，57页ppt

【ST2020硬核课】深度神经网络，57页ppt

专知会员服务

48+阅读 · 2020年8月19日

(ICML 2020 Tutorial)贝叶斯深度学习与概率模型构建，134页ppt

(ICML 2020 Tutorial)贝叶斯深度学习与概率模型构建，134页ppt

专知会员服务

91+阅读 · 2020年7月30日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

246+阅读 · 2020年6月20日

【元学习 | ICASSP2020提交论文】学习低资源语音识别，国立台湾大学 | 李宏毅

【元学习 | ICASSP2020提交论文】学习低资源语音识别，国立台湾大学 | 李宏毅

专知会员服务

57+阅读 · 2019年11月21日

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

专知会员服务

27+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄罗斯常规陆地作战方式：冷战后四次重大军事行动的比较案例研究》286页

中文版 | 美国海军陆战队计划于2026年初为步兵营列装三款新型巡飞弹药

中文版 | 边缘ISR：对抗环境中的情报革新

《美国空军协同作战飞机项目的端到端评估》最新66页报告

相关资讯

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

专知

0+阅读 · 2022年10月12日

什么是因果深度学习？DeepMind最新ICML2022《因果性与深度学习:协同、挑战和未来》教程，183页ppt详述因果DL

什么是因果深度学习？DeepMind最新ICML2022《因果性与深度学习:协同、挑战和未来》教程，183页ppt详述因果DL

专知

9+阅读 · 2022年7月21日

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

【2022新书】元学习(Meta Learning ): 自动机器学习与数据挖掘

专知

19+阅读 · 2022年3月7日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知

21+阅读 · 2021年10月25日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

专知

21+阅读 · 2020年2月5日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

新智元

13+阅读 · 2019年1月2日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

相关基金

基于自适应特征学习和表观建模的目标跟踪算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于三维视频多视觉任务协同分析研究

国家自然科学基金

0+阅读 · 2013年12月31日

带跳扩散模型的非参数统计推断研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于单元重用的海量DVE场景的渐进式对等网络传输关键技术

国家自然科学基金

0+阅读 · 2012年12月31日

非参数变换模型的统计推断

国家自然科学基金

0+阅读 · 2012年12月31日

医学图像的高容量及鲁棒可逆水印的研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于混合式学习分类器的协作多机器人系统的调度控制方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

Beta-arrestins 在突触可塑性和学习记忆中的作用研究

国家自然科学基金

0+阅读 · 2008年12月31日

基于超分辨率技术的视频重构与编码研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Carbon-Intelligent Global Routing in Path-Aware Networks

Arxiv

0+阅读 · 2023年5月1日

Meta Self-Refinement for Robust Learning with Weak Supervision

Arxiv

1+阅读 · 2023年4月30日

ReLBOT: A Transfer Learning Approach to Minimize Reinforcement Learning Risks in Smart Buildings

Arxiv

0+阅读 · 2023年4月30日

NVIDIA FLARE: Federated Learning from Simulation to Real-World

Arxiv

0+阅读 · 2023年4月28日

Adversarial Policy Optimization in Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年4月27日

Multimodal Deep Learning

Arxiv

28+阅读 · 2023年1月12日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

Poolingformer: Long Document Modeling with Pooling Attention

Arxiv

14+阅读 · 2021年5月10日

Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy

Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy

Arxiv

42+阅读 · 2020年12月21日

Adversarial Transfer Learning

Adversarial Transfer Learning

Arxiv

12+阅读 · 2018年12月6日

微信扫码咨询专知VIP会员