Autodesk提出新算法:用「自动编码器网络」生成3D模型!

2017 年 10 月 18 日 全球人工智能 Nobuyuki Umetani

“全球人工智能”拥有十多万AI产业用户,10000多名AI技术专家。主要来自:北大,清华,中科院,麻省理工,卡内基梅隆,斯坦福,哈佛,牛津,剑桥...以及谷歌,腾讯,百度,脸谱,微软,阿里,海康威视,英伟达......等全球名校和名企。


——免费加入AI技术专家社群>>

——免费加入AI高管投资者群>>

——申请成为AI高校推广大使>>



在本文中我们提出了一种新算法,可以将非结构化三角形网格转换为具有一致拓扑结构的机器学习应用程序。我们将正交深度图计算(orthogonal depth map computation)和收缩包装法(the shrink wrapping approach)结合在一起,从而在不考虑诸如反面、孔和自交点等缺陷的情况下,有效且稳健地参数化三角几何形状。转换后的网格是经过连续地、紧凑地参数化的,因此是非常适用于机器学习的。我们使用自动编码器网络来提取同一类别中的多个形状来探索和合成各种形状。除此之外,我们还引入一个直接操作界面来对合成过程进行导航。 我们在用非结构化三角形网格表示的1000多个汽车形状中展示了我们的方法。


 

图1:从非结构化三角形网格(左),我们的方法可以有效和具有鲁棒地构造一个具有一致拓扑结构(中间)的四边形网格,它是一个被紧凑参数化的高度图(height map)(以颜色轮廓表示)。自动编码器构造一组形状的低维表示以合成新形状(右)。我们的界面使得用户在合成过程中能够通过直接操纵形状来交互地引导合成。


简介:众所周知,近年来在机器学习领域取得了非凡的发展成就,从而引入了诸如分类、风格迁移和生成等各种应用,而这些应用的目标媒体就是图像和音频。不过非常遗憾的是,尽管现在互联网上有大量的3D形状可供使用,但3D形状并没有从机器学习中获得诸多益处。这主要是因为机器学习算法要求输入和输出数据具有一致的表示,例如正交排列的网格(即图像中的像素)。非结构化三角形网格是计算机图形中最受欢迎的曲面表示,但它们的拓扑结构通常是彼此互不相同的,从而阻碍了在机器学习的使用。


在本文中,我们提出了一种新的参数化技术,该方法可以有效地将给定的非结构化网格转换为使用深度信息的具有一致连通性的流形网格。我们的参数化方法对于诸如孔、间隙和倒三角形之类的缺陷是具有非常稳健的鲁棒性的。我们通过将形状表示为一个强场(hight field),从而实现了对一个3D形状的紧凑和明确的参数化,它是从一个简单的原始多边形的细分中得以提升的。我们通过对超过1000个汽车形状进行参数化从而来证明我们方法具有稳健的鲁棒性。



我们参数化的主要优点是生成准备进行机器学习的输入和输出数据(图1-中间)。从同一类别中的许多形状中,我们的自动编码器网络构成了这些形状的流形(manifold)。使用自动编码器的低维表示,我们可以在交互速率下生成和探索三维形状的变化(见图1右)。

我们还提供了交互式操纵三维形状合成结果的界面,允许用户直接指定生成形状的顶点的位置。我们的贡献概括如下:

  • 紧凑和高效地参数化三维形状。

  • 自动编码器构建三维形状的流形。

  • 用于探索生成形状的直接操纵界面。

 

结论

 

我们引入了一个参数化方法,将深度图和吸塑包装法结合起来,强有力地构建了一个连续参数化的三维形状的机器学习。我们进一步展示了使用自动编码器构造形状流形,并提出了一个界面来直接操纵三维形状的产生。

 

我们的方法不适用于高度凹陷的形状,如字符的形体,因为粗糙的几何体离立方体很遥远。 这不是一个根本的限制,因为我们可以将基本最粗的网格改变为非立方体(如粗四边形网格),或者将形状分割成多个参数化的凸起部分。我们也考虑使用汽车形状的多重表示来改善自动驾驶汽车的物体检测框架。


论文:https://www.autodeskresearch.com/sites/default/files/paper.pdf

原文:https://www.autodeskresearch.com

系统学习,进入全球人工智能学院

热门文章推荐

汤晓鸥教授:人工智能让天下没有难吹的牛!

英伟达发布全球首款人工智能全自动驾驶平台

未来 3~5 年内,哪个方向的机器学习人才最紧缺?

中科院步态识别技术:不看脸 50米内在人群中认出你!

厉害|黄仁勋狂怼CPU:摩尔定律已死 未来属于GPU!

干货|7步让你从零开始掌握Python机器学习!

华裔女科学家钱璐璐,发明仅20纳米的DNA机器人!

Geoffrey Hinton提出capsule 概念,推翻反向传播!

2017年7大最受欢迎的AI编程语言:Python第一!

重磅|中国首家人工智能技术学院在京揭牌开学!

登录查看更多
1

相关内容

【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
94+阅读 · 2020年6月19日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
78+阅读 · 2020年5月24日
专知会员服务
74+阅读 · 2020年5月21日
姿势服装随心换-CVPR2019
专知会员服务
36+阅读 · 2020年1月26日
基于Siamese网络的多视角三维人脸重建
计算机视觉战队
5+阅读 · 2019年11月28日
从数据结构到算法:图网络方法初探
机器之心
7+阅读 · 2019年8月12日
【泡泡点云时空】PointPillars:点云物体检测的快速编码器
李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构
全球人工智能
5+阅读 · 2019年1月14日
【学界】基于生成对抗网络的低秩图像生成方法
GAN生成式对抗网络
9+阅读 · 2018年7月13日
支持向量机分类实战
全球人工智能
4+阅读 · 2017年10月18日
用Python实现CNN长短期记忆网络!
全球人工智能
9+阅读 · 2017年8月22日
3D Deep Learning on Medical Images: A Review
Arxiv
12+阅读 · 2020年4月1日
Arxiv
12+阅读 · 2019年1月24日
Recurrent Fusion Network for Image Captioning
Arxiv
3+阅读 · 2018年7月31日
Arxiv
5+阅读 · 2018年5月21日
Arxiv
6+阅读 · 2018年4月3日
VIP会员
相关资讯
基于Siamese网络的多视角三维人脸重建
计算机视觉战队
5+阅读 · 2019年11月28日
从数据结构到算法:图网络方法初探
机器之心
7+阅读 · 2019年8月12日
【泡泡点云时空】PointPillars:点云物体检测的快速编码器
李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构
全球人工智能
5+阅读 · 2019年1月14日
【学界】基于生成对抗网络的低秩图像生成方法
GAN生成式对抗网络
9+阅读 · 2018年7月13日
支持向量机分类实战
全球人工智能
4+阅读 · 2017年10月18日
用Python实现CNN长短期记忆网络!
全球人工智能
9+阅读 · 2017年8月22日
相关论文
Top
微信扫码咨询专知VIP会员