点击上方“CVer”,选择加"星标"或“置顶”
重磅干货,第一时间送达
本文有以下结构:
简介
发展方向
方向一:Semantic Mapping
方向二:Real Semantic SLAM
LSD-SLAM + DeepLab-v2 (语义分割) 流程:输入 -> 选关键帧并 refine(非关键帧用于增强深度估计)-> 2D语义分割 -> 语义优化+3D重建 ① 为保证速度,仅对关键帧来进行语义分割, ② 其他帧用 small-baseline stereo comparisons [7] 对关键帧做深度估计的优化 ③ 使用 Recursive Bayes 增强语义分割 ④ 3D重建的优化使用条件随机场(CRF),同 SemanticFusion
使用 RGB-D 和 ORB-SLAM2 可构建一个 dense 的点云。 对于关键帧,SSD 检测出多个 Object,应用无监督的3D分割方法 [11] 为每一个 Object 分配点云序列,并存储起来。 数据关联:得到一组分割结果(Object, 对应点云)后,据点云重心的欧式距离,在找出最接近的一组候选 Object,如果 超过 50% 的点对的距离小于一个阈值(文中 2cm),就认为是匹配到的 Object,否则认为是新 Object,存储下来。 匹配为同一 Object 的两个点云,直接 累加分类概率(置信度)。这和上文提到的 Recursive Bayes 方法很像, 即利用 SLAM 提供的物体多角度信息,增强分割结果。 (注:本文的 Related Work 写得很好)
如上图所示,(a) 为语义分割图,(b) 为类别 “Car” 的区域,在(c) (d) 中,根据与 Car 区域的距离,概率值从1 (红) 变为 0 (蓝)。其他类别如Tree,也会产生此概率分布图。 其中 距离 到 概率 的转化,利用了下方的高斯分布,(c) (d) 的不同是方差 导致的。这是在为量化重投影误差做准备。对于一个空间点P(拥有坐标 )来说,重投影之后计算得到一个概率: 其中 计算了重投影的结果 与类别 c 区域的 最近距离,最后得到的 用于 计算重投影误差: 权重 的存在是为了解决数据关联,即空间点P应该以哪一个类别的区域为目标, 。其由多个相机下的 值累乘,即多个角度观测投票决定。 会加到普通的 BA 优化公式中,使用 EM 算法进行优化,E 步更新权重 ,而 M 步优化三维点P坐标和相机位姿(普通的 BA 过程)。 个人理解,之所以使用高斯分布,是因为其函数有“骤降”之处,那么方差 可以起到决定阈值的作用,让 距离超过阈值的类别区域更快得到一个小权重 ,多个相机的投票下,数据关联很快就能稳定下来,可以加速优化。 (为简化说明,上述公式已被简化,去除了对于多个相机、空间点的索引,详见原文)
利用语义分割,将一些类别( )区域定义为背景(绿色),其他类别( )区域定义为可移动物体。 接下来使用 运动判定,以区分可移动物体当前是静止(蓝色)还是运动(红色)的。 运动判定的规则如下:对于某一语义区域内,过往估计的特征点的 3D 位置,投影到当前的新图像上, 重投影位置若和对应特征点的欧式距离大于一定阈值,则定义为移动点,如果该区域 移动点的比例大于一定阈值则判定为移动区域。
ORB-SLAM2.
[2]也来谈语义SLAM/语义地图.
[3]视觉SLAM十四讲.
[4]lsd-SLAM.
[5]SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks.
[6]Semi-Dense 3D Semantic Mapping from Monocular SLAM.
[7]Semi-dense Visual Odometry for a Monocular Camera - IEEE Conference Publication.
[8]Meaningful Maps With Object-Oriented Semantic Mapping.
[9]MaskFusion: Real-Time Recognition, Tracking and Reconstruction of Multiple Moving Objects.
[10]Meaningful Maps With Object-Oriented Semantic Mapping.
[11]Geometrically consistent plane extraction for dense indoor 3D maps segmentation - IEEE Conference Publication.
[12]Probabilistic Data Association for Semantic SLAM.
[13]VSO: Visual Semantic Odometry.
[14]DS-SLAM: A Semantic Visual SLAM towards Dynamic Environments.
[15]Mask-SLAM: Robust feature-based monocular SLAM by masking using semantic segmentation.
[16]A Unified Framework for Mutual Improvement of SLAM and Semantic Segmentation.
[17]Long-term Visual Localization using Semantically Segmented Images.
[18]Global Localization with Object-Level Semantics and Topology - IEEE Conference Publication.
推荐阅读
2020年AI算法岗求职群来了(含准备攻略、面试经验、内推和学习资料等)
重磅!CVer-SLAM 交流群已成立
扫码添加CVer助手,可申请加入CVer-SLAM 微信交流群,目前已满500+人,旨在SLAM相关等内容。
一定要备注:研究方向+地点+学校/公司+昵称(如SLAM+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加群
▲长按关注我们
麻烦给我一个在看!