击败谷歌、微软、Facebook,中国团队称雄世界AI竞赛

2017 年 10 月 30 日 创新工场


一家中国创业公司的技术团队,在国际顶级赛事上,击败了来自微软、Facebook、Google、商汤科技等企业,以及卡内基梅隆大学、北京大学、香港中文大学、上海交通大学等高校的竞争者,成为第一个在 COCO 竞赛中获得冠军的中国企业。


这个公司是旷视科技(Face++)在MS COCO共七项挑战项目中,旷视科技(Face++)研究院团队参与了其最重要的四项,并获得了三项第一、一项第二的成绩。


MS COCO是计算机视觉领域最受关注和最权威的比赛之一,是图像(物体)识别方向最重要的标杆,也是目前国际领域唯一一个能够汇集 Google、Microsoft、Facebook 三大巨头,国际顶尖院校以及优秀创新企业共同参与的大赛。这个比赛也代表了继 ImageNet 后的图像识别的最高水平。


图:旷视科技Face++参赛团队


图文来源  量子位  |  公众号 QbitAI


又一次!中国团队拿下一项AI赛事的多个大奖!


8天的计算机视觉顶会ICCV 2017在威尼斯悄然落幕,期间中国团队在物体检测、人体关键点检测等竞争激烈的比赛中击败了谷歌、微软、Facebook等国际巨头AI实验室。


ICCV 2017 “Joint COCO and Places Recognition Challenge” Workshop中,一共公布了7项竞赛的结果。


中国AI创业公司旷视科技(Face++)MS COCO物体检测、人体关键点检测,以及Places物体分割三项比赛中击败微软、谷歌、Facebook等对手,夺得了第一名



 旷视科技获COCO物体检测、人体关键点检测冠军;UCenter获COCO物体分割冠军

而在MS COCO物体分割检测中,由北京大学和香港中文大学联合组成的UCenter队(也可以理解为商汤科技队)夺得冠军,旷视科技(Face++)团队获得了第二名。


Places场景分割挑战赛的冠军由中科院自动化所和京东联合建立的CASIA_IVA_JD队拿下,第二名是今日头条的WinterIsComing队。



参赛选手总结


量子位还得到一份旷视Face++此次参赛主力队员的一份赛后总结。这份总结应该是出自大三学生肖特特,他还特别提到队友罗睿轩和姜博睿。转发如下:


拿奖拿到手软


终于,可以自豪地宣布,我们Face++团队在备受关注的MSCOCO和由MIT牵头的Places比赛中参与四个项目,击败Facebook, Google, Microsoft, 国内外高校和企业等,拿下三项世界冠军一项第二名。其中我作为核心成员之一参与了COCO Detection & Instance Segmentation与Places Instance Segmentation三个项目,并为COCO Skeleton做了一点点微小的贡献。


关于比赛


一支团队能同事拿下那么多冠军是史无前例的。在最重要的COCO Detection中,我们赢了第二名近2个绝对百分点。在Places比赛,我们在准备不充分的情况下(我的错),赢了第二名Google4.5个绝对百分点。为我们的队伍感到自豪。


“Face++模式”


对于我来说,赢了是团队好输了当然是自己做得不够好。这次比赛,我特别要介绍旷视的platform组。他们负责维护和建立上千块gpu的集群,支持各种功能。而我们,动辄要求几十上百块gpu跨机训练,给他们造成了前所未有的压力。但是,他们每次几乎立即处理问题,以最快的速度解决。这是我见过的最敬业,效率最高的team. 每一块奖牌后面都应该有他们的名字。


“姚班模式”


我特别想提一下,在两个Segmentation比赛中,我的两位室友,罗睿轩和姜博睿,比我做出了更大贡献。他们也是我的ACM队友。这是我一直追求的姚班模式。作为朋友,室友。大家每时每刻、自发地讨论学术问题,取得比赛好成绩,或者一起发表论文。很高兴我在身体力行,为这个模式做了一些微小的贡献。感谢室友的不杀之恩,因为我实在太push了…把人从床里拖出来review代码这事发生了不止一次。比赛结束前每天熬夜到三四点,第二天接着干。很不容易,Good job!


关于ICCV


第一次在国际会议做Presentation, 居然上台后一点都不紧张。我要了一个手持麦克风,借了个遥控器,成为了唯一一个不在讲台后讲slides的人 XD. 被偶像级前辈Ross Girshick夸报告讲得非常好,真的特别开心。


关于research


准备今年的CVPR和明年ECCV submissions. 手里攒了不少东西。借用Kaiming的一句话”涨3个点很容易,涨3个点讲个故事也不难,最难的是想一个idea, 并且指出它能涨3个点”. 跟这些人交流得越多,我越来越知道自己应该做什么样的工作,什么样的工作是有意义的,值得尊敬的。希望在明年ECCV投稿的工作中,能看到自己一点点往这个方向的努力。



有趣的事情


  1. 与Ross和Kaiming聊了一会,我表达了对两位role models的敬佩,讲我一直在向各位学习。Ross大神说你明年要是能来FAIR实习就太好了。我们没准还能向你学习呢。脑子一下空白了…回答,现在不够格和各位一起工作,phd时一定一定会申你的intern :)

  2. 三年级本科生的身份倒是能让大家迅速记住你 23333 真的比平均年龄小了太多。

  3. 感谢NVIDIA送了一块TITAN XP,以为还是之前的一万美元呢哈哈。


另外,据商汤科技透露他们的队伍也是实习生担任主力。


历史战绩


物体检测这个项目,是MS COCO大赛的重头戏,从2015年第一届就存在,第二、三届中依然延续了下来。


其实,拿下2015年物体检测项目冠军的MSRA团队,就是孙剑在微软亚洲研究院带领的一组研究员,包括何恺明、任少卿、代季峰和Xiangyu Zhang,所用的算法,是何恺明和RBG大神第一次合作的Faster R-CNN。


2016年的物体检测冠军,是谷歌研究院的G-RMI队,而用的算法,依然是Faster R-CNN。


2015年第一届MS COCO大赛中除了物体检测,还有个生成图片说明(Captioning Challenge)项目,当时夺冠的谷歌团队,与人类baseline相比依然差了一大截,这个比赛项目也没能继续下去。


在2016年,物体检测之外的比赛项目变成了人体关键点检测,当时夺冠的团队来自CMU。


COCO+Places 2017简介


MS COCO是一个已经举办了三年,在业内颇有名气的比赛。今年的MS COCO共有四个项目,包括物体检测、物体分割、人体关键点检测和场景分割。

和MS COCO联合公布结果的Places今年还是第一届,由MIT和CMU牵头,包括物体分割、场景分割和边缘检测三个项目,旨在深度理解图像场景。



COCO挑战赛


COCO是一个图像数据集,被设计用来推动物体检测研究,特别是检测上下文中的物体。其中提供的注释包括80个分类的物体像素级分割,人体实例的关键点注释,91个类别的背景语义分割。


大赛具体包括:


01  COCO检测挑战


COCO 2017检测挑战赛已在推动物体检测领域的进步。参赛队伍要在两类物体检测挑战中竞争:使用包围盒(bounding box)输出或者物体分割输出。



02  COCO关键点挑战


这项挑战需要在复杂环境下对人体关键点进行定位。这项挑战需要在检测出人体的同时,对关键点进行定位标注。



03  COCO背景语义分割挑战


今年的挑战中,已经给出人、汽车、大象等物体的分类,所以重点主要在背景分类的部分,例如草坪、墙壁、天空等。



相关详情可以访问:

http://cocodataset.org/Palces



Places挑战的数据,是一个像素级标注的图像数据及ADE20K。这个数据集中有2万张图像用于训练,2千张用于验证,3千张用于测试。


数据集地址在此:

http://groups.csail.mit.edu/vision/datasets/ADE20K/


Places 2017的挑战主要有三个任务:场景分割(scene parsing)、物体分割(instance segmentation)、边缘检测(semantic boundary detection)



详细信息可以访问这里:

http://placeschallenge.csail.mit.edu/


AI Challenger挑战赛明日截止,

最后的夺冠机会!

 

“AI Challenger全球AI挑战赛”是由创新工场、搜狗和今日头条三家国内人工智能领域领军企业共同发起的竞赛活动,面向人工智能领域科研人才,致力于打造大型、全面的科研数据集与世界级竞赛平台。

 

自8月14日开放报名以来,AI Challenger平台上汇聚了世界各地参赛者,不仅来自高校,包括中国清华大学、北京大学、上海交通大学、复旦大学、中科大、香港科技大学、香港中文大学、台湾大学,美国康奈尔大学、佐治亚理工、纽约大学,英国剑桥大学、帝国理工学院,德国卡尔斯鲁厄大学,法国国立路桥学校,澳洲卧龙岗大学,日本早稻田大学;而且来自公司机构,包括中科院、百度、蚂蚁金服、小米、搜狐、奇虎360、众安保险、平安科技、同花顺、陌陌、迅雷、中国移动、中国电信、格灵深瞳、驭势科技、摩拜,微软、通用电气、英特尔、eBay、Micron、法国巴黎银行,还有神秘的公安部院所

 

参赛者中也不乏曾经在各种大赛上叱咤风云的牛人,比如天池阿里移动推荐算法大赛冠军、首届、第二届滴滴DI-tech算法大赛冠军、ImageNet目标分类任务和定位任务双料冠军、中兴算法精英挑战赛冠军,IBM-滴滴编程马拉松大赛冠军,以及Kaggle大赛银牌获得者十余位。

 

本次大赛提供了百万量级的计算机视觉数据集,包括: 

70万个人体骨骼关键点标注数据

30万张图片场景标注和语义描述数据


这是国内迄今公开的规模最大的科研数据集,已经在大赛官网(challenger.ai)上线,供参赛选手下载,进行算法设计、模型训练及评估。

 

主办方为首届竞赛准备了超过200万元人民币的奖金,供参赛优秀选手分享。另外还将努力为条件有限的参赛选手提供免费GPU资源的支持,帮助他们圆梦AI!

 

值得一提的是,因为旷视的标注团队参与了其中中文图像描述竞赛的标注,所以这是一个拒绝了世界冠军旷世科技参加的比赛,有没有觉得自己夺冠的机会大了一些?:)


大赛报名明天(10月31日)就要截止,欢迎大家来挑战!

 

大赛官网:challenger.ai

小助手二维码:


 


推荐阅读:

欢迎关注创新工场微信公众号:chuangxin2009。这是一个创新工场和创业者的沟通交流平台,您可以学习创业相关的法务、市场、财务、HR等各个业务领域所需的知识干货,还有机会参与到创新工场举办的创业者培训、沙龙和其他各类活动中。


登录查看更多
0

相关内容

Face++TM是北京旷视科技有限公司旗下的新型视觉服务平台,Face++TM平台通过提供云端API、离线SDK、以及面向用户的自主研发产品形式,将人脸识别技术广泛应用到互联网及移动应用场景中,人脸识别云计算平台市场前景广阔。
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
109+阅读 · 2020年4月12日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
腾讯AI Lab斩获知识图谱顶级赛事KBP 2017世界冠军
全球人工智能
10+阅读 · 2017年12月1日
【消息】自动化所获计算机视觉大会ICCV2017场景解析竞赛冠军
中国科学院自动化研究所
5+阅读 · 2017年11月6日
UPSNet: A Unified Panoptic Segmentation Network
Arxiv
3+阅读 · 2019年1月12日
Arxiv
6+阅读 · 2018年6月18日
Arxiv
6+阅读 · 2018年4月23日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
13+阅读 · 2017年12月5日
VIP会员
相关VIP内容
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
109+阅读 · 2020年4月12日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
相关论文
UPSNet: A Unified Panoptic Segmentation Network
Arxiv
3+阅读 · 2019年1月12日
Arxiv
6+阅读 · 2018年6月18日
Arxiv
6+阅读 · 2018年4月23日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
13+阅读 · 2017年12月5日
Top
微信扫码咨询专知VIP会员