主题: Meet AdaMod: a new deep learning optimizer with memory

简介: AdaMod是一个新的深度学习优化器,它建立在Adam的基础上,但提供了一个自动预热启发式和长期学习率缓冲。从最初的测试来看,AdaMod是一个前5名的优化器,它很容易击败或超过vanilla Adam,同时对学习率超参数不太敏感,训练曲线更平滑,不需要热身模式。

成为VIP会员查看完整内容
14

相关内容

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支。
MATLAB玩转深度学习?新书「MATLAB Deep Learning」162页pdf
专知会员服务
98+阅读 · 2020年1月13日
深度学习优化算法总结(SGD,AdaGrad,Adam等)
极市平台
33+阅读 · 2019年4月30日
介绍高维超参数调整 - 优化ML模型的最佳实践
AI研习社
7+阅读 · 2019年4月17日
7个实用的深度学习技巧
机器学习算法与Python学习
16+阅读 · 2019年3月6日
你真的懂时间序列预测吗?
腾讯大讲堂
103+阅读 · 2019年1月7日
基于LSTM深层神经网络的时间序列预测
论智
21+阅读 · 2018年9月4日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
深度学习基础之LSTM
全球人工智能
26+阅读 · 2017年12月18日
CNN超参数优化和可视化技巧详解
量子位
4+阅读 · 2017年7月15日
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
7+阅读 · 2018年6月19日
Arxiv
8+阅读 · 2018年5月15日
VIP会员
相关VIP内容
MATLAB玩转深度学习?新书「MATLAB Deep Learning」162页pdf
专知会员服务
98+阅读 · 2020年1月13日
相关资讯
深度学习优化算法总结(SGD,AdaGrad,Adam等)
极市平台
33+阅读 · 2019年4月30日
介绍高维超参数调整 - 优化ML模型的最佳实践
AI研习社
7+阅读 · 2019年4月17日
7个实用的深度学习技巧
机器学习算法与Python学习
16+阅读 · 2019年3月6日
你真的懂时间序列预测吗?
腾讯大讲堂
103+阅读 · 2019年1月7日
基于LSTM深层神经网络的时间序列预测
论智
21+阅读 · 2018年9月4日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
深度学习基础之LSTM
全球人工智能
26+阅读 · 2017年12月18日
CNN超参数优化和可视化技巧详解
量子位
4+阅读 · 2017年7月15日
相关论文
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
7+阅读 · 2018年6月19日
Arxiv
8+阅读 · 2018年5月15日
微信扫码咨询专知VIP会员