题目: Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation
摘要: 我们提出了一个新的模型,称为多通道注意选择生成对抗网络(SelectionGAN),用于指导图像到图像的翻译,我们在尊重外部语义引导的前提下,将输入图像转换成另一幅图像。所提出的选择GAN显式地利用了语义引导信息,包括两个阶段。在第一阶段,输入图像和条件语义引导被输入到循环语义引导生成网络中,产生初始的粗糙结果。在第二阶段,我们使用所提出的多尺度空间池和信道选择模块以及多信道注意选择模块来细化初始结果。此外,利用从注意图中自动学习到的不确定性图来指导像素损失,以获得更好的网络优化效果。在四个具有挑战性的引导图像到图像转换任务(面部、手部、身体和街道视图)上进行的详尽实验表明,我们的选择GAN能够产生明显优于现有技术方法的效果。同时,所提出的框架和模块是统一的解决方案,可用于解决语义图像合成等其他生成任务。
作者简介: Hao Tang,伊利诺伊大学厄巴纳-香槟分校(UIUC)电子与计算机工程系的博士生,贝克曼高等科学技术学院图像形成与处理组(IFP组)的研究生助理。个人主页:http://www.ifp.illinois.edu/~haotang2/index.html