残差模块的普通卷积替换成深度可分离卷积 后,loss高居不下,是什么原因呢?

关注者
5
被浏览
3,582
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

更换conv block,loss不收敛,大概率是衔接部位数据异常。比如,普通卷积的输入一般是用过ReLu的,但Depth-wise conv block的最终输出是不带ReLu。所以数值范围会不一样。但这大概率不是根本原因。建议再多给一些其他信息。