谷歌街景摄像头迎来重大升级,Waymo 亦将受益海量高清数据

2017 年 9 月 6 日 机器之能 HelloWorld

谷歌街景影像采集车的新摄像头使得图像更高清,因此,提取到的信息也更可信。这不仅能让新的谷歌软件产品更加理解这个世界,也为公司的自动驾驶技术实力再添重要筹码。


编译 | 高静宜 王艺 邱陆陆

作者 | Tom Simonite

来源 | 《连线》


曾经为 NASA 的两个火星探测漫游者打造过摄像头。此时,这个为 NASA 提供摄像头技术的牛人正在一家普通的谷歌停车场里,端详自己的最新作品:固定在现代汽车车顶上的装置。四根白色支架,支撑着一个搭载了八个摄像头的黑色竖杆。有了这个稍显笨拙的装置,汽车高度几乎增加了一倍。「我们为它骄傲,不过也曾考虑过把它们遮起来。怪咖是这样的。」Silverman 说道。

Silverman 和他的团队打造的硬件,可供谷歌街景进行图像采集。2007 年上线以来,谷歌街景已经积累了超过 1000 万英里的全景图像,包括公路、建筑,甚至偶然拍摄到的随地大小便等,这些全景信息会放到网上共享。此次全新设计是八年来的首次重大升级。上个月,团队开始定期上街进行图像采集。逐渐收集回来的数据,将增强谷歌从数字角度掌控世界的能力。

考虑到 2009 年手机使用的摄像头水平,谷歌街景图像追求的是更高清晰度。即使坐在沙发上也可以浏览到分辨率更高、也更具冲击力的世界图景。不过,这次新设计的硬件并不仅仅是为了提升人们视觉体验,汽车顶部装置内嵌的两个摄像头可以分别从车身两侧捕获静态的高清图像,为谷歌训练图像识别算法提供更清晰的近距离建筑物及道路标牌图像。

这些算法可以不知疲倦地读取数以百万计的标牌和店面图片。吸收了海量街道可视化信息,包括路牌、店铺名称、甚至是街角小吃店窗口上的营业时间,谷歌有望提升本已强大的测绘数据库。这家靠索引网站算法起家的巨头,正用相同的战略为真实世界建立索引。



全球监测

谷歌街景这一想法几乎与谷歌的成立一样久远。2001 年,也就是谷歌成立的三年后,公司 CEO Larry Page 带着一盘录像带前往斯坦福大学的图形实验室。录像带录制了他的行车情况,他希望研究人员想办法充分利用影片中的图片数据。当时,这个项目被命名为「crawling the phys
ical web」。2006 年,采用了相关技术的谷歌街景车首次上路。一年后,公司正式发布街景计划。

十年后,谷歌街景车在 85 个国家的上千座城市,拍摄了 800 多亿张照片。常规测绘数据更为广泛。不过,谷歌仍追寻着更好索引世界的办法。「人们每天都会带给我们更难、更深的问题。」公司副总裁、地图部门负责人 Jen Fitzpatrick 表示。

第一次使用谷歌地图或谷歌街景搜索,你可能会输入一条街道的名字,或者你自己所处的位置。Fitzpatrick 说,现在公司遇到一些非常棘手的问题,例如,「配送范围内,还在营业的泰国菜馆子是哪家?」,我们急需一个可以实时更新的、也更为详细的真实世界的数字模型。

她希望谷歌街景地图能够回答类似的问题,这需要系统对这个社会的模样有所了解。「街角教堂旁边的粉红色店面叫什么名字?」谷歌在大力推动用户使用其虚拟助手的同时,也逐渐培养出用户用口语说出其需求的习惯。「像这样的问题,只有在我们的系统拥有更丰富、更深层次的信息的时候,才能解答。」Fitzpatrick 说。

好在谷歌对于机器学习以及人工智能方面的投入巨大,街景团队才有能力获得这些信息。团队目前正在进行的一项工作是,当街景地图采集车路过某一条街,采集到长长的沿街影像时,算法能够通过定位以及转写图片中的街道名字以及数字,自动为谷歌地图更新地址信息。值得一提的是,街景部门是谷歌所有产品部门中第一个使用谷歌定制芯片 TPU 的团队。

该系统还自己学会了辨认缩写,例如 AV. 表示大道。通过对比分析全国其它路牌上的名字,并结合谷歌地图上已有的数据,系统学会了缩写与全称的对应关系。研究人员还训练系统能够学会是被公司名字,当遇到非常有名的公司用 Logo(商标图案)代替名字时,系统也能轻松对号入座。例如当它看到星巴克的海妖 Logo 时,能够辨认出这家店是星巴克。


谷歌街景影像采集车的新摄像头使得图像更高清,因此,提取到的信息也更可信。「从机器学习的角度出发,一切都变得容易多了。」团队中的工程师 Andrew Lookingbill 说。他们希望系统能够自动识别店铺的类型,并且增加例如营业时间等细粒度信息。团队的成果甚至能够被转化为新的软件产品,这些产品具备更好地理解世界的能力。



新的领域

用算法解码道路、城市和商业活动高速变化、但经济不甚发达地区的街景图像,特别有用。这也是谷歌及其对手们争夺「下一个十亿用户」的战场。印度政府发布报告称,印度近期的道路修建速度为每天 14 英里。今年夏天,尼日利亚首都拉各斯的谷歌街景地图正式上线,这座城市的人口达 2100 万。Fitzpatrick 表示,谷歌的图像索引算法能够帮助地图业务拓宽新的盈利渠道,例如在地图中夹杂广告。这样,新的城市覆盖以及更高的准确率在吸引更多用户使用的同时能够带来新的收益。

谷歌希望吸引全球人民参与其地图项目。科技界对 VR(虚拟现实)的热情使得 360 度全景摄像机价格有所下降。自今年夏天以来,谷歌已经赋予一些相机 Street View Ready(街景资格)认证。这意味着你可以通过街景 APP(应用程序)向谷歌上传你自己的全景照片,随后,和谷歌自己采集到的照片一样,你上传的照片将被谷歌的图像识别软件解析并提取最新的地图信息。

谷歌希望通过众包的形式维持街景地图数据的有效性。「谷歌已经将(互联网)世界索引起来。」街景地图的产品经理 Charles Armstrong 说。「但是谷歌永不满足于现状。」谷歌以虚拟奖品的形式回报向其地图做贡献的用户,谷歌希望用户能够自发地参与进来。Armstrong 预测到,不久的将来,公司、旅游景区、甚至政府将会开着他们自己的顶部装有相机的汽车采集图像,来确保谷歌地图和世界同时进化。


谷歌街景的各式更新都有助于谷歌保持其在数字地图界的领先地位。谷歌可以说是全球为数不多的地图测绘项目中最突出的一个了。另一些重量级参与者包括:由一系列德国汽车公司持有的 HERE;以独立 GPS 设备和手表闻名的 Tomtom;以及协作项目 Open Street Map。「每家都以其他公司作为标准衡量自己的水准。」Open Street Map 美国分布主席 Alyssa Wright 如是说。(苹果进入地图测绘圈的时间相对较晚,它的数据来自 Tomtom。)如今大多数人都随身携带有 GPS 功能的智能手机,因此地图数据的重要程度已经远远超过了指引方向。「从自动驾驶车辆到约会软件,地图是建设数字化未来的基础。」Wright 如是说。

街景所使用的新摄像头和谷歌对于众包图像采集的推动可能会为公司引来更多隐私争议。从街景项目开始以来,把短暂的公共场景变成了互联网上永久的存档的行为就时不时会遇到集中爆发的用户担忧。德国和奥地利的大部分地区已经有相当多年在谷歌街景上都是不可见的了,这是因为谷歌曾经陷入「街景车擅自记录 Wi-Fi 数据」的麻烦。街景车最近刚刚得以重回这两个国家。2012 年,瑞士最高法院勒令谷歌削减摄像头数量以防止其越墙偷窥,并要求其模糊处理女性收容所等场景。

Fitzpatrick 表示,高质量图像可能会带来更多隐私问题。「我们还没有遇到有更多隐私需求的情况,」她说。谷歌会继续将自己获取的街景图片中的人脸和汽车牌照做模糊处理。但是对众包图像来说,这并非一个默认选项,而让采用了让用户在上传时自行选择是否使用谷歌的模糊处理技术。

运用图像处理算法,谷歌能够从这些街景照片中获取多少额外信息呢?答案是,非常多。

今年早些时候,斯坦福大学的研究人员,包括现任谷歌云服务的首席科学家李飞飞教授,展示了他们能通过建模,使用谷歌街景图片中出现的汽车的型号、生产年限等信息,来预测特定美国城市的收入水平、种族比例和政治倾向。而当记者询问谷歌是否参与了这些项目的规划时,谷歌的发言人回答说,谷歌只会运用洁净数据来改善公司的平台和产品,包括地图,以及地图之外的其他产品。

而对谷歌街景图像以及其用户的分析也可能会对其谷歌的兄弟公司,致力于自动驾驶的 Waymo 产生帮助。「我们的团队会时不时进行合作。」Fitzpatrick 只肯说这么多。当然,反过来,她的团队也会从 Waymo 处受益。

回到谷歌的停车场,摄影师 Silverman 承认,在高速公路上驾驶街景车并不好玩。「开上一天,你就会不想再做『公交车司机』,回归工程工作了。」他说。就像自动驾驶会改变叫车服务的经济歌剧一样,「不再需要支付街景车司机工资」也会对街景工作产生重大改变。毕竟,谷歌试图给物理世界创建算法索引的工作,才刚刚开始。



登录查看更多
1

相关内容

谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎。公司总部称为“Googleplex”,位于美国加州圣克拉拉县的芒廷维尤。业务包括互联网搜索、云计算、广告技术等,同时开发并提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广告服务。
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
163+阅读 · 2020年4月26日
【CVPR2020-Facebook AI】前置不变表示的自监督学习
专知会员服务
46+阅读 · 2020年4月19日
【CVPR2020】多模态社会媒体中危机事件分类
专知会员服务
53+阅读 · 2020年4月18日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
谷歌之困:谷歌为什么做不好硬件?
ZEALER订阅号
3+阅读 · 2019年11月21日
最新版本开源情报工具和资源手册(一)
黑白之道
9+阅读 · 2019年6月23日
无人驾驶仿真软件
智能交通技术
21+阅读 · 2019年5月9日
2017企业阵亡最全名单公布
小饭桌
6+阅读 · 2018年2月28日
海康威视AI Cloud助力平安城市4.0建设
海康威视
7+阅读 · 2018年1月17日
你见过马化腾17年前写的代码吗?
互联网it观察
5+阅读 · 2017年7月3日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
4+阅读 · 2018年4月9日
Arxiv
5+阅读 · 2016年1月15日
VIP会员
相关资讯
谷歌之困:谷歌为什么做不好硬件?
ZEALER订阅号
3+阅读 · 2019年11月21日
最新版本开源情报工具和资源手册(一)
黑白之道
9+阅读 · 2019年6月23日
无人驾驶仿真软件
智能交通技术
21+阅读 · 2019年5月9日
2017企业阵亡最全名单公布
小饭桌
6+阅读 · 2018年2月28日
海康威视AI Cloud助力平安城市4.0建设
海康威视
7+阅读 · 2018年1月17日
你见过马化腾17年前写的代码吗?
互联网it观察
5+阅读 · 2017年7月3日
相关论文
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
4+阅读 · 2018年4月9日
Arxiv
5+阅读 · 2016年1月15日
Top
微信扫码咨询专知VIP会员