这篇论文从二值化网络训练过程中的常见问题切入,一步步给出对应的解决方案,最后收敛到了一个实用化的训练策略。接下来就跟着这篇论文一起看看二值化网络(BNN)应该如何优化。

首先,BNN 的优化器应该如何选取?

可以看到,BNN 的优化曲面明显不同于实数值网络,如下图所示。实数值网络在局部最小值附近有更加平滑的曲面,因此实数值网络也更容易泛化到测试集。相比而言,BNN 的优化曲面更陡,因此泛化性差并且优化难度大。

成为VIP会员查看完整内容
15

相关内容

专知会员服务
20+阅读 · 2021年9月16日
专知会员服务
21+阅读 · 2021年8月1日
专知会员服务
31+阅读 · 2021年7月19日
专知会员服务
12+阅读 · 2021年7月4日
专知会员服务
26+阅读 · 2021年5月23日
深度学习网络调参技巧
AINLP
15+阅读 · 2019年11月15日
如何训练你的ResNet(三):正则化
论智
5+阅读 · 2018年11月13日
【教程】如何估算深度神经网络的最优学习率
GAN生成式对抗网络
5+阅读 · 2017年11月18日
教程 | 如何估算深度神经网络的最优学习率
机器之心
3+阅读 · 2017年11月17日
VIP会员
相关VIP内容
专知会员服务
20+阅读 · 2021年9月16日
专知会员服务
21+阅读 · 2021年8月1日
专知会员服务
31+阅读 · 2021年7月19日
专知会员服务
12+阅读 · 2021年7月4日
专知会员服务
26+阅读 · 2021年5月23日
相关资讯
深度学习网络调参技巧
AINLP
15+阅读 · 2019年11月15日
如何训练你的ResNet(三):正则化
论智
5+阅读 · 2018年11月13日
【教程】如何估算深度神经网络的最优学习率
GAN生成式对抗网络
5+阅读 · 2017年11月18日
教程 | 如何估算深度神经网络的最优学习率
机器之心
3+阅读 · 2017年11月17日
微信扫码咨询专知VIP会员