阿里联合学界开源大型3D场景数据集,6813个户型,几何与纹理细节丰富

2020 年 8 月 11 日 计算机视觉life

点击上方“计算机视觉life”,选择“星标”

快速获得最新干货

本文转自机器之心

源于阿里巴巴淘系的工业生产流程,兼具质量与数量,模型包含丰富的几何与纹理细节,阿里巴巴联合学界开源的场景布局数据集 3D-FRONT 将填补大规模高质量 3D 场景布局数据集空白的现状。
近期,阿里巴巴淘系技术部门的赵斌强、贾荣飞等与西蒙弗雷泽大学的张皓教授以及中科院计算所的高林、张凌霄多方共同合作,在 CVPR 2020 的 Workshop“Learning 3D Generative” 中开源了 大型 3D 场景数据集 3D-FRONT(3D Furnished Rooms with layOuts and semaNTics),以填补目前学界在大规模高质量 3D 场景布局数据集上空白的现状 。其中,张皓教授是 CVPR 2020“Learning 3D Generative”Workshop 的核心组织者之一。

以下为 3D-FRONT 数据集中一个典型场景数据的漫游视频:


接下来我们来看 3D-FRONT 的技术细节。

3D 场景数据将推动基于 AI 的 3D 应用研究

图 1:三维室内场景研究与应用。

3D 与 2D 场景理解是打造未来 AI 世界所研究的基础核心课题,涵盖机器人室内寻路、线上商城、室内设计等室内场景相关的应用。这些应用的背后涉及到语义分割、物体识别、场景生成等深度学习相关的理论与技术,而这些技术都是需要依赖大量数据来训练相关深度模型从而发挥作用。

因此, 高质量的大型 3D 场景数据集对于上述相关研究的推动具有重大意义

然而,现阶段学术界亟须大规模高质量的 3D 场景数据集以支持和推动数据驱动的智能化 3D 场景的相关研究,特别是具有高质量布局与室内设计的 3D 场景数据集。

目前,相关的数据集有,例如:普林斯顿大学提出的 SUNCG、斯坦福大学提出的 ScanNet、上海科技大学提出的 structured3D 等,但是这些数据集存在场景内容不够丰富,数据规模不够庞大的问题。比如,structured3D 数据集中虽然提供了 3 千多个场景,但是未能提供具有高质量纹理的三维模型数据。

图 2:3D-FRONT 数据采集流程。

阿里巴巴作为世界级的电商互联网巨头,其官方家装家居设计平台 - 躺平设计家积累了海量高质量家居设计方案。

以这些真实家居场景为基础,阿里巴巴淘系技术部结合 3D 人工智能技术初步打造了场景化数字营销,推出了智能设计搭配服务,并创造了大量精美场景布局与设计数据 。这些场景数据很好地契合了学术界的需求。

一言以蔽之,3D-FRONT 数据集源于阿里巴巴淘系的工业生产流程,兼具质量与数量。

3D-FRONT 填补学术界 3D 场景布局数据空白

图 3:3D-FRONT 数据集属性。

3D-FRONT 包含 6,813 个真实户型,平均每个户型包含 7 个房间场景,其中 19,775 个房间场景具有人工验证过的精美室内设计信息 。每个房间内涉及的家具均来自于阿里巴巴已开源的 3D 模型数据集 3D-FUTURE(3D FUrniture shapes with TextURE),该数据集的模型都包含丰富的几何与纹理细节。

相比于其他 3D 场景数据集, 3D-FRONT 在以下指标处于领先地位,包括户型数目、房间场景数目和房间类型等,并且还提供了高质量硬装模型和家具模型

场景中的 3D 几何模型具有丰富的几何细节与高质量的纹理图,这些几何模型来自于阿里巴巴已开源的 3D 模型库数据集 3D-FUTURE。

图 4:3D-FRONT 与其他场景数据集对比。

目前,3D-FRONT 与 3D-FUTURE 数据集已对外开放并提供下载。

  • 3D-FRONT 数据集主页:https://tianchi.aliyun.com/specials/promotion/alibaba-3d-scene-dataset

  • 3D-FUTURE 数据集主页:https://tianchi.aliyun.com/specials/promotion/alibaba-3d-future

  • Learning 3D Generative Models CVPR 2020 Workshop: https://learn3dgen.github.io/


3D-FRONT 数据集贡献者

3D-FRONT数据集的贡献者共有7位,分别是来自阿里巴巴的Huan Fu、Bowen Cai、贾荣飞和赵斌强,中科院计算技术研究所的高林和张凌霄,以及西蒙弗雷泽大学的张皓。

END




专辑:计算机视觉方向简介

专辑:视觉SLAM入门

专辑:最新SLAM/三维视觉论文/开源

专辑:三维视觉/SLAM公开课

专辑:深度相机原理及应用

专辑:手机双摄头技术解析与应用

专辑:相机标定

专辑:全景相机


从0到1学习SLAM,戳↓

视觉SLAM图文+视频+答疑+学习路线全规划!

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


投稿、合作也欢迎联系:simiter@126.com

长按关注计算机视觉life

登录查看更多
0

相关内容

3D是英文“Three Dimensions”的简称,中文是指三维、三个维度、三个坐标,即有长、有宽、有高,换句话说,就是立体的,是相对于只有长和宽的平面(2D)而言。
【ECCV2020】EfficientFCN:语义分割中的整体引导解码器
专知会员服务
15+阅读 · 2020年8月23日
【Google】多模态Transformer视频检索,Multi-modal Transformer
专知会员服务
101+阅读 · 2020年7月22日
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
92+阅读 · 2020年6月19日
【SIGIR2020-微软】知识图谱上的增强推荐推理
专知会员服务
73+阅读 · 2020年5月30日
最新开源 RGBD+IMU数据集:FMDataset
计算机视觉life
42+阅读 · 2019年9月21日
【泡泡图灵智库】点云序列的语义分割数据集
泡泡机器人SLAM
9+阅读 · 2019年9月20日
直播 | 室内场景的结构化重建
AI研习社
6+阅读 · 2018年8月31日
Arxiv
0+阅读 · 2020年10月12日
Learning Implicit Fields for Generative Shape Modeling
Arxiv
10+阅读 · 2018年12月6日
Two Stream 3D Semantic Scene Completion
Arxiv
4+阅读 · 2018年7月16日
Arxiv
3+阅读 · 2018年1月31日
VIP会员
Top
微信扫码咨询专知VIP会员