英伟达和MIT的成果,研究了视频到视频的合成。论文中,研究人员提出了一种新型的视频到视频的合成方法,以生成对抗学习框架为基础结构。使用精心设计的生成器和判别器架构,以及时空对抗目标,研究者输入分割掩码、草稿以及动作后,得到了高分辨率、写实的视频结果。值得一提的是,该模型还能生成最长30秒的2K视频。
地址:https://arxiv.org/abs/1808.06601
理解、推理、使用图像的语义概念是过去几十年基本研究问题之一。先前的工作主要是对自然图像直接进行描边、定位关键点、填充空白。在这篇论文中,我们对语义图像处理提出了一种新的分层框架,在其中我们采用结构化的语义布局作为操作的中间表示。该框架能让用户一次性进行添加、删除、移动边界框等操作。实验证明分层框架在质量和数量上都优于现有方法。
地址:https://arxiv.org/abs/1808.07535
由于胶囊网络的注意力和分层关系,它可能是处理生物结构问题的有力工具。这篇论文描述了较难网络结构对RAS蛋白质家族的分类。经过训练的胶囊网络可以顺利分辨HRAS和KRAS结构。
地址:https://arxiv.org/abs/1808.07475