Ensemble Model

计算所博士

motivation：模型整合多个模型，会优于单个模型的性能。但是会引入过多的参数和计算量，本文提出一个新的整合方法，采用多个注意力头，生成多个不同的特征。

方法：

问题：

文中约束不同分支生成的特征不同，但是这些特征表示的是同一个ID，会不会产生歧义？（原则上不同的part也应该映射到一个最终度量空间的一个点吧）
分支特征的阈值 m_{div} 与对比损失的阈值 m_{c} 相同，但是原则上应该满足：同一个图像不同分支的特征距离<不同ID的图像特征距离。
不同part的特征可能对于度量有用，比如，行人再识别的分块操作。
不能用到erase的操作中，应为erase的一个分支为attention=1，为了使erase后的特征分类正确，会不断挖掘不同的特征，使第一个分支也关注到更多的区域，从而使其他分支可能会挖掘到背景信息。

编辑于 2019-11-18 16:03

博士paper