模型的Fisher信息矩阵的对角线部分(即“Fisher对角线”)常被用作衡量参数敏感性的一种方式。 通常,Fisher对角线是通过对模型似然函数关于其参数的梯度平方进行采样估计,并在几百到几千个样本上取平均而得到的——这一过程会带来不小的计算开销。与此同时,诸如广泛使用的Adam优化器这类自适应梯度方法,在训练过程中会计算梯度平方的滑动平均。 因此,本文探索了一个问题:是否可以通过“回收”在训练过程中已计算好的平方梯度累加器,从而“免费”获得Fisher对角线的近似值。 通过覆盖Fisher对角线五种应用场景的一系列综合实验证明,这种方法(我们称之为“Squisher”,即以平方梯度累加器近似Fisher)在表现上与Fisher对角线一致,并优于其他基线方法。 此外,我们还阐明了Squisher与Fisher对角线之间的具体差异,并对它们各自的影响进行了实证量化。

成为VIP会员查看完整内容
2

相关内容

【KDD2024】面向鲁棒推荐的决策边界感知图对比学习
专知会员服务
21+阅读 · 2024年8月8日
【ICML2023】无消息传递的transformer图归纳偏差
专知会员服务
26+阅读 · 2023年6月1日
NeurIPS 2021 | 寻找用于变分布泛化的隐式因果因子
专知会员服务
16+阅读 · 2021年12月7日
【NeurIPS 2021】学会学习图拓扑
专知会员服务
25+阅读 · 2021年10月22日
专知会员服务
16+阅读 · 2021年10月4日
专知会员服务
26+阅读 · 2021年9月9日
专知会员服务
23+阅读 · 2021年7月31日
专知会员服务
44+阅读 · 2021年7月1日
专知会员服务
41+阅读 · 2021年6月19日
专知会员服务
50+阅读 · 2021年6月2日
【NeurIPS2019】图变换网络:Graph Transformer Network
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
详解常见的损失函数
七月在线实验室
20+阅读 · 2018年7月12日
CNN 反向传播算法推导
统计学习与视觉计算组
30+阅读 · 2017年12月29日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
473+阅读 · 2023年3月31日
Arxiv
18+阅读 · 2021年3月16日
Exploring Visual Relationship for Image Captioning
Arxiv
15+阅读 · 2018年9月19日
VIP会员
相关VIP内容
【KDD2024】面向鲁棒推荐的决策边界感知图对比学习
专知会员服务
21+阅读 · 2024年8月8日
【ICML2023】无消息传递的transformer图归纳偏差
专知会员服务
26+阅读 · 2023年6月1日
NeurIPS 2021 | 寻找用于变分布泛化的隐式因果因子
专知会员服务
16+阅读 · 2021年12月7日
【NeurIPS 2021】学会学习图拓扑
专知会员服务
25+阅读 · 2021年10月22日
专知会员服务
16+阅读 · 2021年10月4日
专知会员服务
26+阅读 · 2021年9月9日
专知会员服务
23+阅读 · 2021年7月31日
专知会员服务
44+阅读 · 2021年7月1日
专知会员服务
41+阅读 · 2021年6月19日
专知会员服务
50+阅读 · 2021年6月2日
相关资讯
【NeurIPS2019】图变换网络:Graph Transformer Network
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
详解常见的损失函数
七月在线实验室
20+阅读 · 2018年7月12日
CNN 反向传播算法推导
统计学习与视觉计算组
30+阅读 · 2017年12月29日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员