内容与风格(C-S)的解耦是风格转移中的基本问题和关键挑战。基于明确的定义(例如,Gram矩阵)或隐式学习(例如,GANs)的现有方法既不可解释也不易于控制,导致了交织的表示和不太令人满意的结果。在这篇论文中,我们提出了一种新的C-S解耦风格转移框架,不使用之前的假设。关键的洞见是明确地提取内容信息并隐式地学习互补的风格信息,从而产生可解释和可控的C-S解耦和风格转移。我们引入了一个简单而有效的基于CLIP的风格解耦损失,与风格重建先验协同工作,以在CLIP图像空间中解耦C-S。通过进一步利用扩散模型的强大风格去除和生成能力,我们的框架比现有的技术获得了更好的结果,并具有灵活的C-S解耦和权衡控制。我们的工作为风格转移中的C-S解耦提供了新的洞见,并展示了扩散模型在学习良好解耦的C-S特征方面的潜力。

https://www.zhuanzhi.ai/paper/8d378770385d06a12fb8c52a58f315f4

成为VIP会员查看完整内容
24

相关内容

扩散模型是近年来快速发展并得到广泛关注的生成模型。它通过一系列的加噪和去噪过程,在复杂的图像分布和高斯分布之间建立联系,使得模型最终能将随机采样的高斯噪声逐步去噪得到一张图像。
【ICML2023】基于最优多任务插值的多模态基础模型迁移
专知会员服务
29+阅读 · 2023年4月29日
【NeurIPS2022】GENIE:高阶去噪扩散求解器
专知会员服务
16+阅读 · 2022年11月13日
专知会员服务
21+阅读 · 2021年10月8日
专知会员服务
14+阅读 · 2021年9月11日
【CVPR2021】跨模态检索的概率嵌入
专知会员服务
19+阅读 · 2021年3月2日
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
【NeurIPS2022】GENIE:高阶去噪扩散求解器
专知
0+阅读 · 2022年11月13日
【NeurIPS2022】基于最大熵编码的自监督学习
【ICML2022】熵因果推理:图的可辨识性
专知
0+阅读 · 2022年8月6日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2023年10月4日
Arxiv
131+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
326+阅读 · 2023年3月31日
Arxiv
56+阅读 · 2023年3月26日
VIP会员
相关VIP内容
【ICML2023】基于最优多任务插值的多模态基础模型迁移
专知会员服务
29+阅读 · 2023年4月29日
【NeurIPS2022】GENIE:高阶去噪扩散求解器
专知会员服务
16+阅读 · 2022年11月13日
专知会员服务
21+阅读 · 2021年10月8日
专知会员服务
14+阅读 · 2021年9月11日
【CVPR2021】跨模态检索的概率嵌入
专知会员服务
19+阅读 · 2021年3月2日
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
相关基金
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员