今日 Paper | 跨模态行人重识别；对抗时尚迁移；学会注意错误；凸混合整数规划等

会员服务 ·

今日 Paper | 跨模态行人重识别；对抗时尚迁移；学会注意错误；凸混合整数规划等

2020 年 3 月 12 日 AI科技评论

跨模态行人重识别：共享与特异特征变换算法cm-SSFT

论文名称：Cross-modality Person re-identification with Shared-Specific Feature Transfer

作者：Yan Lu

发表时间：2020/2/1

论文链接：https://arxiv.org/pdf/2002.12489.pdf

推荐原因

本文主要是解决红外线-RGB跨模态行人重识别的问题。由于Specific feature在对面模态中是不存在的，所以目前工业界大部分跨模态行人在识别算法通常只关注shared feature learning，很少关注Specific feature，比如在红外线图片中是没有彩色颜色信息的。

主要创新点：利用近邻信息：给定一红外线query。当搜索彩色target时，可以先找到一些简单的置信度高的彩色样本，接着把这些彩色样本的颜色特异特征给与红外线query，如此往复，便可以实现利用这些彩色信息再去搜索更难的彩色样本的功能。

GarmentGAN：具有图片真实感的对抗时尚迁移

论文名称：GarmentGAN: Photo-realistic Adversarial Fashion Transfer

作者：Amir Hossein Raffiee /Michael Sollami

发表时间：2020/3/4

论文链接：https://arxiv.org/abs/2003.01894

推荐原因

基于机器学习的服装迁移是近些年的一个研究热点，是将虚拟试衣落地的较为现实的解决方案，具有非常大的商业价值和市场前景。

一般服装迁移问题包含两个任务：一是学习将目标人体和服装分离，二是生成目标人体穿着任意衣服的新的图片。本文提出的GarmentGAN是一种基于生成对抗网络的服装迁移算法，其包含两个独立的GAN：形状迁移网络和外观迁移网络，分别处理这两个任务，能够生成较为逼真的目标图片，对于复杂的人体姿态、手部姿势、遮挡情况都能处理的不错。作者最后将GarmentGAN与目前state-of-the-art的方法进行了定性和定量的比较，证明了该方法的有效性。

学习将纹理从服装图像转移到3D人体

论文名称：Learning to Transfer Texture from Clothing Images to 3D Humans

作者：Aymen Mir /Thiemo Alldieck /Gerard Pons-Moll

发表时间：2020/3/4

论文链接：https://arxiv.org/abs/2003.02050

推荐原因

本文已被CVPR2020接收，提出了一种实时自动的从衣服图片的纹理迁移到SMPL人体模型的3D服装上，是一种3D虚拟试衣的最新解决方案，数据和代码将被开源，目前尚未公开。项目地址：https://virtualhumans.mpi-inf.mpg.de/pix2surf/。

作者首先使用非刚性3D到2D注册的方法，生成了服装图片和3D外衣的数据对，这种方法非常准确但是速度很慢。然后作者基于这些数据对，通过神经网络学习了图片像素到3D服装表面的映射。作者通过实验表面该方法比基于薄板样条的图片变形和图片到图片的迁移网络更加准确更加快速。

文章方法提供了3D虚拟试衣的新方法，效果逼真，速度快(实时)，值得关注。

学会注意错误

论文名称：Learning to pay attention on mistakes

作者：Anonymous authors

发表时间：2020/1/25

论文链接：https://openreview.net/pdf?id=s-cP4jKXG1

推荐原因

在医学图像分割任务中，重点是从背景像素中检测和区分出代表感兴趣区域的前景像素。到目前为止，背景像素构成了图像中大多数像素。这导致基于深度学习的医学图像分割频繁出现的假阴性像素分类，即前景像素被错误地分类为属于背景像素类别。作者提出了一种新的注意力机制来解决这种较高的假阴性检测率。作者的方法试图引导模型进行更多的假阳性检测，从而纠正由于训练数据不平衡而导致的分类结果不平衡。提出的注意力机制有三种实现方式：（1）显式指导模型以检测误报；（2）通过转向相反的假阴性来隐式学习假阳性；（3）在多任务环境中，共同引导假阳性和假阴性的学习。为了验证提出的方法，作者在一个比较难的任务中验证了我们提出的网络：对肿瘤核心进行分割。在BRATS 2018训练数据上进行5次交叉验证后，作者的模型优于9个最新的基准模型，包括：空间注意力，空间通道注意力和自我注意力。作者的第三种实现将假阴性降低了10.4％，而假阳性的检增加却可以忽略不计。作者的第三个方案还将网络的Hausdorff距离提高了28％以上，同时将IoU值提高了3％以上。除了显著的性能提升外，提出的注意机制通过一个有效的感受也具有直观的可解释。因为该论文还在Under Review，为了保持保持匿名，该论文隐藏了GitHub上的代码的链接，后续会公布。