iPhone X的原深感相机到底是个什么玩意?

2017 年 10 月 16 日 计算机视觉life sixgod

   欢迎关注计算机视觉life


9月13日苹果发布了致敬十周年的新机型iPhone X,其中前置原深感(TrueDepth)相机引起了极大的舆论关注。该相机的构成如下图所示。从左到右,依次是红外镜头、泛光感应元件、距离传感器、环境光传感器、扬声器、麦克风、700万像素摄像头、点阵投影器。其中最有里程碑意义的当属红外镜头 + 点阵投影器 + RGB摄像头的组合。后面会具体解释原因。


iPhone X 前置原深感相机


据苹果官方介绍,iPhoneX通过前置点阵投影器将超过30000个肉眼不可见的光点投影到人脸,再根据红外镜头接收到的反射光点,就可以计算得到人脸深度图。 RGB摄像头拍摄的2D人脸结合计算的深度人脸信息,经过算法处理就可以绘制出精确细致的3D人脸。该技术安全性极高,可以轻松的识别出普通RGB相机难以处理的利用打印照片、软件合成、面具等进行的人脸识别攻击,可以安全方便的进行人脸活体检测。该技术用于iPhone的人脸解锁方案,称为FaceID,是iPhone X最重要的新功能之一。


点阵投影在人脸上的示意图

(其实投影的是人眼不可见的红外光,这里只是示意图)


在3D人脸模型的基础上,苹果除了推出FaceID,还衍生出了艺术自拍、人像光效、动画表情等一系列实用有趣的玩法。


iPhone X的“动画表情”功能示意图


作为手机行业的先驱者,苹果的3D人脸技术带来的这些突破性的玩法将给消费者市场带来巨大的变化,随之而来的是安卓手机厂商的追随,这将会迎来3D技术在手机等移动终端的爆发。


其实,苹果的“原深感相机”中的“红外镜头 + 点阵投影器 + RGB摄像头”的组合本质上就是一种基于结构光技术深度相机。那么,什么是深度相机呢?


顾名思义,深度相机就是可以获取场景中物体距离摄像头物理距离的相机。深度相机通常由多种镜头和光学传感器组成,根据测量原理不同,主流的深度相机一般分为以下几种方法:飞行时间法、结构光法、双目立体视觉法。


飞行时间是从Time of Flight直译过来的,简称TOF。其测距原理是通过连续发射经过调制的特定频率的光脉冲(一般为不可见光)到被观测物体上,然后接收从物体反射回去的光脉冲,通过探测光脉冲的飞行(往返)时间来计算被测物体离相机的距离。


飞行时间法原理示意图


结构光法就是使用提前设计好的具有特殊结构的图案(比如离散光斑、条纹光、编码结构光等),将图案投影到三维空间物体表面上,使用另外一个相机观察在三维物理表面成像的畸变情况。如果结构光图案投影在该物体表面是一个平面,那么观察到的成像中结构光的图案就和投影的图案类似,没有变形,只是根据距离远近产生一定的尺度变化。但是,如果物体表面不是平面,那么观察到的结构光图案就会因为物体表面不同的几何形状而产生不同的扭曲变形,而且根据距离的不同而不同,根据已知的结构光图案及观察到的变形,就能根据算法计算被测物的三维形状及深度信息。


结构光法原理示意图


双目立体视觉法的原理和人眼类似,通过计算空间中同一个物体在两个相机成像的视差就可以根据如下三角关系计算得到物体离相机的距离。


双目立体视觉原理示意图


目前消费市场上常见的深度相机主要包括微软的Kinect系列、华硕的Xtion、Intel的Realsense系列等。深度相机在三维建模、自然人机交互(手势/人脸识别)、AR/VR、自动驾驶等领域有非常广泛的应用。但是由于技术的限制,深度相机很难做到体积非常有限、功耗要求低的手机上。因此iPhone X此次发布的基于结构光技术的深度相机意义重大。


部分消费级深度相机产品


事实上,iPhoneX并非是第一个将深度相机应用到手机上的,2016年Google和联想就合作推出了全球第一个搭载Project Tango技术的手机Phab2 Pro,该手机的深度相机采用英飞凌的TOF方案。从原理上来说,iPhone X的结构光方案比Phab2 Pro TOF方案来说具有功耗低,分辨率及精度高等优点。这些优势对于在移动设备上实现生物特征识别来说意义重大。


其实早在iPhone X发布之前,安卓阵营的手机厂商、模组厂商、算法供应商等产业链也都一直在全力追逐苹果的步伐,在深度相机上进行持续的研发投入。预计今年底到明年,我们将会看到更多搭载了深度相机的手机出现,而基于3D技术的移动端应用很可能会在VR/AR、三维建模、手势识别等领域率先爆发,让我们一起拭目以待。


本公众号后续将推出一系列关于深度相机原理和技术应用的文章,敬请关注。



      IOS用户打赏通道

如本文对你有用,欢迎打赏、转发、分享


登录查看更多
0

相关内容

iPhone 由苹果公司(Apple, Inc.)首席执行官史蒂夫·乔布斯在 2007 年 1 月 9 日举行的 Macworld 宣布推出,2007 年 6 月 29 日在美国上市,将创新的移动电话、可触摸宽屏 iPod 以及具有桌面级电子邮件、网页浏览、搜索和地图功能的突破性因特网通信设备这三种产品完美地融。
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
专知会员服务
84+阅读 · 2019年12月13日
【机器学习课程】Google机器学习速成课程
专知会员服务
162+阅读 · 2019年12月2日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
3D重建:硬派几何求解vs深度学习打天下?
机器之心
5+阅读 · 2019年7月8日
新型相机DVS/Event-based camera的发展及应用
计算机视觉life
16+阅读 · 2019年3月12日
IMU 标定 | 工业界和学术界有什么不同?
计算机视觉life
12+阅读 · 2019年1月8日
抖音的 2017 和它背后的黑科技
PingWest品玩
8+阅读 · 2018年1月4日
计算机视觉方向简介 | 阵列相机立体全景拼接
计算机视觉life
6+阅读 · 2018年1月3日
深度相机应用全面梳理:多点开花,定点爆破
计算机视觉life
6+阅读 · 2017年12月13日
从Face ID说起,浅析人脸识别之刷脸技术
互联网架构师
6+阅读 · 2017年9月25日
“计算机视觉”到底是个啥?
AI100
5+阅读 · 2017年8月3日
Visualizing and Measuring the Geometry of BERT
Arxiv
7+阅读 · 2019年10月28日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
6+阅读 · 2018年10月3日
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
Arxiv
11+阅读 · 2018年1月11日
VIP会员
相关VIP内容
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
专知会员服务
84+阅读 · 2019年12月13日
【机器学习课程】Google机器学习速成课程
专知会员服务
162+阅读 · 2019年12月2日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
相关资讯
3D重建:硬派几何求解vs深度学习打天下?
机器之心
5+阅读 · 2019年7月8日
新型相机DVS/Event-based camera的发展及应用
计算机视觉life
16+阅读 · 2019年3月12日
IMU 标定 | 工业界和学术界有什么不同?
计算机视觉life
12+阅读 · 2019年1月8日
抖音的 2017 和它背后的黑科技
PingWest品玩
8+阅读 · 2018年1月4日
计算机视觉方向简介 | 阵列相机立体全景拼接
计算机视觉life
6+阅读 · 2018年1月3日
深度相机应用全面梳理:多点开花,定点爆破
计算机视觉life
6+阅读 · 2017年12月13日
从Face ID说起,浅析人脸识别之刷脸技术
互联网架构师
6+阅读 · 2017年9月25日
“计算机视觉”到底是个啥?
AI100
5+阅读 · 2017年8月3日
相关论文
Visualizing and Measuring the Geometry of BERT
Arxiv
7+阅读 · 2019年10月28日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
6+阅读 · 2018年10月3日
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
Arxiv
11+阅读 · 2018年1月11日
Top
微信扫码咨询专知VIP会员