Autodesk提出新算法：用「自动编码器网络」生成3D模型！ - 专知

会员服务 ·

0

Autodesk提出新算法：用「自动编码器网络」生成3D模型！

2017 年 10 月 18 日 全球人工智能 Nobuyuki Umetani

“全球人工智能”拥有十多万AI产业用户，10000多名AI技术专家。主要来自：北大，清华，中科院，麻省理工，卡内基梅隆，斯坦福，哈佛，牛津，剑桥...以及谷歌，腾讯，百度，脸谱，微软，阿里，海康威视，英伟达......等全球名校和名企。

——免费加入AI技术专家社群>>

——免费加入AI高管投资者群>>

——申请成为AI高校推广大使>>

在本文中我们提出了一种新算法，可以将非结构化三角形网格转换为具有一致拓扑结构的机器学习应用程序。我们将正交深度图计算（orthogonal depth map computation）和收缩包装法（the shrink wrapping approach）结合在一起，从而在不考虑诸如反面、孔和自交点等缺陷的情况下，有效且稳健地参数化三角几何形状。转换后的网格是经过连续地、紧凑地参数化的，因此是非常适用于机器学习的。我们使用自动编码器网络来提取同一类别中的多个形状来探索和合成各种形状。除此之外，我们还引入一个直接操作界面来对合成过程进行导航。我们在用非结构化三角形网格表示的1000多个汽车形状中展示了我们的方法。

图1：从非结构化三角形网格（左），我们的方法可以有效和具有鲁棒地构造一个具有一致拓扑结构（中间）的四边形网格，它是一个被紧凑参数化的高度图（height map）（以颜色轮廓表示）。自动编码器构造一组形状的低维表示以合成新形状（右）。我们的界面使得用户在合成过程中能够通过直接操纵形状来交互地引导合成。

简介：众所周知，近年来在机器学习领域取得了非凡的发展成就，从而引入了诸如分类、风格迁移和生成等各种应用，而这些应用的目标媒体就是图像和音频。不过非常遗憾的是，尽管现在互联网上有大量的3D形状可供使用，但3D形状并没有从机器学习中获得诸多益处。这主要是因为机器学习算法要求输入和输出数据具有一致的表示，例如正交排列的网格（即图像中的像素）。非结构化三角形网格是计算机图形中最受欢迎的曲面表示，但它们的拓扑结构通常是彼此互不相同的，从而阻碍了在机器学习的使用。

在本文中，我们提出了一种新的参数化技术，该方法可以有效地将给定的非结构化网格转换为使用深度信息的具有一致连通性的流形网格。我们的参数化方法对于诸如孔、间隙和倒三角形之类的缺陷是具有非常稳健的鲁棒性的。我们通过将形状表示为一个强场（hight field），从而实现了对一个3D形状的紧凑和明确的参数化，它是从一个简单的原始多边形的细分中得以提升的。我们通过对超过1000个汽车形状进行参数化从而来证明我们方法具有稳健的鲁棒性。

我们参数化的主要优点是生成准备进行机器学习的输入和输出数据（图1-中间）。从同一类别中的许多形状中，我们的自动编码器网络构成了这些形状的流形（manifold）。使用自动编码器的低维表示，我们可以在交互速率下生成和探索三维形状的变化（见图1右）。

我们还提供了交互式操纵三维形状合成结果的界面，允许用户直接指定生成形状的顶点的位置。我们的贡献概括如下：

紧凑和高效地参数化三维形状。
自动编码器构建三维形状的流形。
用于探索生成形状的直接操纵界面。

结论

我们引入了一个参数化方法，将深度图和吸塑包装法结合起来，强有力地构建了一个连续参数化的三维形状的机器学习。我们进一步展示了使用自动编码器构造形状流形，并提出了一个界面来直接操纵三维形状的产生。

我们的方法不适用于高度凹陷的形状，如字符的形体，因为粗糙的几何体离立方体很遥远。这不是一个根本的限制，因为我们可以将基本最粗的网格改变为非立方体（如粗四边形网格），或者将形状分割成多个参数化的凸起部分。我们也考虑使用汽车形状的多重表示来改善自动驾驶汽车的物体检测框架。

论文：https://www.autodeskresearch.com/sites/default/files/paper.pdf

原文：https://www.autodeskresearch.com

系统学习，进入全球人工智能学院

热门文章推荐

汤晓鸥教授：人工智能让天下没有难吹的牛!

英伟达发布全球首款人工智能全自动驾驶平台

未来 3~5 年内，哪个方向的机器学习人才最紧缺？

中科院步态识别技术：不看脸 50米内在人群中认出你！

厉害｜黄仁勋狂怼CPU:摩尔定律已死未来属于GPU!

干货｜7步让你从零开始掌握Python机器学习！

华裔女科学家钱璐璐，发明仅20纳米的DNA机器人！

Geoffrey Hinton提出capsule 概念，推翻反向传播！

2017年7大最受欢迎的AI编程语言：Python第一!

重磅｜中国首家人工智能技术学院在京揭牌开学！

登录查看更多

1

相关内容

拓扑结构

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

专知会员服务

95+阅读 · 2020年6月19日

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

紧凑的神经网络模型设计研究综述

专知会员服务

74+阅读 · 2020年5月21日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

36+阅读 · 2020年2月27日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

专知会员服务

40+阅读 · 2020年1月12日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

基于Siamese网络的多视角三维人脸重建

基于Siamese网络的多视角三维人脸重建

计算机视觉战队

5+阅读 · 2019年11月28日

从数据结构到算法：图网络方法初探

从数据结构到算法：图网络方法初探

机器之心

7+阅读 · 2019年8月12日

【泡泡点云时空】PointPillars：点云物体检测的快速编码器

【泡泡点云时空】PointPillars：点云物体检测的快速编码器

泡泡机器人SLAM

7+阅读 · 2019年6月23日

【学界】李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

【学界】李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

GAN生成式对抗网络

9+阅读 · 2019年1月14日

李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

全球人工智能

5+阅读 · 2019年1月14日

深度学习新应用：在PyTorch中用单个2D图像创建3D模型

深度学习新应用：在PyTorch中用单个2D图像创建3D模型

机器之心

4+阅读 · 2019年1月11日

【学界】谷歌NeurIPS 2018论文：GAN生成3D模型，图像自带逼真效果

【学界】谷歌NeurIPS 2018论文：GAN生成3D模型，图像自带逼真效果

GAN生成式对抗网络

7+阅读 · 2018年12月7日

【学界】基于生成对抗网络的低秩图像生成方法

【学界】基于生成对抗网络的低秩图像生成方法

GAN生成式对抗网络

9+阅读 · 2018年7月13日

支持向量机分类实战

支持向量机分类实战

全球人工智能

4+阅读 · 2017年10月18日

用Python实现CNN长短期记忆网络！

用Python实现CNN长短期记忆网络！

全球人工智能

9+阅读 · 2017年8月22日

3D Deep Learning on Medical Images: A Review

3D Deep Learning on Medical Images: A Review

Arxiv

13+阅读 · 2020年4月1日

Learning to Estimate Pose and Shape of Hand-Held Objects from RGB Images

Learning to Estimate Pose and Shape of Hand-Held Objects from RGB Images

Arxiv

5+阅读 · 2019年3月8日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

Recurrent Fusion Network for Image Captioning

Recurrent Fusion Network for Image Captioning

Arxiv

3+阅读 · 2018年7月31日

Learning to Generate and Reconstruct 3D Meshes with only 2D Supervision

Learning to Generate and Reconstruct 3D Meshes with only 2D Supervision

Arxiv

5+阅读 · 2018年7月24日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

GANE: A Generative Adversarial Network Embedding

Arxiv

5+阅读 · 2018年5月21日

Learning to Guide Decoding for Image Captioning

Arxiv

6+阅读 · 2018年4月3日

Stack-Captioning: Coarse-to-Fine Learning for Image Captioning

Arxiv

6+阅读 · 2018年3月14日

VIP会员

相关主题

相关VIP内容

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

专知会员服务

95+阅读 · 2020年6月19日

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

紧凑的神经网络模型设计研究综述

专知会员服务

74+阅读 · 2020年5月21日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

36+阅读 · 2020年2月27日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

专知会员服务

40+阅读 · 2020年1月12日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

基于Siamese网络的多视角三维人脸重建

基于Siamese网络的多视角三维人脸重建

计算机视觉战队

5+阅读 · 2019年11月28日

从数据结构到算法：图网络方法初探

从数据结构到算法：图网络方法初探

机器之心

7+阅读 · 2019年8月12日

【泡泡点云时空】PointPillars：点云物体检测的快速编码器

【泡泡点云时空】PointPillars：点云物体检测的快速编码器

泡泡机器人SLAM

7+阅读 · 2019年6月23日

【学界】李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

【学界】李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

GAN生成式对抗网络

9+阅读 · 2019年1月14日

李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

李飞飞等人提出Auto-DeepLab：自动搜索图像语义分割架构

全球人工智能

5+阅读 · 2019年1月14日

深度学习新应用：在PyTorch中用单个2D图像创建3D模型

深度学习新应用：在PyTorch中用单个2D图像创建3D模型

机器之心

4+阅读 · 2019年1月11日

【学界】谷歌NeurIPS 2018论文：GAN生成3D模型，图像自带逼真效果

【学界】谷歌NeurIPS 2018论文：GAN生成3D模型，图像自带逼真效果

GAN生成式对抗网络

7+阅读 · 2018年12月7日

【学界】基于生成对抗网络的低秩图像生成方法

【学界】基于生成对抗网络的低秩图像生成方法

GAN生成式对抗网络

9+阅读 · 2018年7月13日

支持向量机分类实战

支持向量机分类实战

全球人工智能

4+阅读 · 2017年10月18日

用Python实现CNN长短期记忆网络！

用Python实现CNN长短期记忆网络！

全球人工智能

9+阅读 · 2017年8月22日

相关论文

3D Deep Learning on Medical Images: A Review

3D Deep Learning on Medical Images: A Review

Arxiv

13+阅读 · 2020年4月1日

Learning to Estimate Pose and Shape of Hand-Held Objects from RGB Images

Learning to Estimate Pose and Shape of Hand-Held Objects from RGB Images

Arxiv

5+阅读 · 2019年3月8日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

Recurrent Fusion Network for Image Captioning

Recurrent Fusion Network for Image Captioning

Arxiv

3+阅读 · 2018年7月31日

Learning to Generate and Reconstruct 3D Meshes with only 2D Supervision

Learning to Generate and Reconstruct 3D Meshes with only 2D Supervision

Arxiv

5+阅读 · 2018年7月24日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

GANE: A Generative Adversarial Network Embedding

Arxiv

5+阅读 · 2018年5月21日

Learning to Guide Decoding for Image Captioning

Arxiv

6+阅读 · 2018年4月3日

Stack-Captioning: Coarse-to-Fine Learning for Image Captioning

Arxiv

6+阅读 · 2018年3月14日

大家都在搜

软件无线电

大型语言模型

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员