动态 | 微软亚洲研究院CVPR圆桌：机器学习火成这样，如何让计算机视觉“独立”发展？

会员服务 ·

动态 | 微软亚洲研究院CVPR圆桌：机器学习火成这样，如何让计算机视觉“独立”发展？

2017 年 6 月 22 日 AI科技评论

300 + 明星创业公司，3000 + 行业人士齐聚全球人工智能与机器人峰会 GAIR 2017，一同见证 AI 浪潮之巅！峰会抢票火热进行中。

今天特放出 直减 750 元的无条件优惠码（见文末，优惠幅度逐天减小），感谢各位读者对雷锋网的支持，打开链接即可使用。

「微软亚洲研究院创研论坛——CVPR 2017 论文分享会」于上周顺利举行。由微软亚洲研究院主办，清华大学媒体与网络技术教育部-微软重点实验室承办，中国图象图形学会视觉大数据专委会、中国计算机学会计算机视觉专委会协办。

会议期间，主办方邀请了在计算机视觉领域非常优秀的学术界、工业界代表们，针对在 CVPR 2017 发表的论文内容进行了分享。

本次圆桌讨论环节由微软亚洲研究院主管研究员罗翀主持，并邀请到了五位在计算机视觉领域的研究者们分享他们的心得见解。

陈熙霖，中国科学院计算技术研究所研究员
王蕴红，北京航空航天大学计算机学院副院长
曾文军，微软亚洲研究院首席研究员
林宙辰，北京大学信息科学技术学院教授
齐国君，美国中佛罗里达大学计算机系助理教授

从左至右：陈熙霖、王蕴红、曾文军、林宙辰、齐国君

讨论点一：深度学习并非万能

AI 科技评论了解到，在本次研讨会上，第一个问题首先提及了深度学习对计算机视觉领域所产生的影响。诚然，深度学习的火热让很多经典问题的解决得到了很大的提升，但它作为一种「有效的」工具，是否真是万能的呢？

陈熙霖博士认为，计算机视觉实际上是一个很宽泛的领域，而不能单纯地用一个工具来代替一个领域。在解决问题的时候，还是需要结合问题背景进行考虑，再确定是否要用深度学习，否则很可能永远达不到最终目的。

王蕴红教授肯定了陈博士的说法，她认为研究人员在解决问题时，不应该把自己当成一个调参的工具。「在这个时候我们依然要关注到问题的本身是什么，怎么样才能够解决问题。所以任何一个工具都不是经久不衰的，但解决问题是经久不衰的，所以我们应该更多关注的是能力的培养。」

此外，林宙辰教授表示，深度学习与传统方法也开始有了一些结合，且前者的优点在某些问题上并不突出，因此还是应该需要注重专业知识的培养和积累。

讨论点二：arXiv 的利弊

此前 AI 科技评论曾经对 Yoav 与 Yann LeCun 关于 arXiv 的论战做了一番解析（详情可阅读此前文章《Yoav Goldberg 与 Yann LeCun 论战背后：arXiv 是个好平台，但和学术会议是两码事》），得出的结论是，arXiv 作为一个投递论文的平台，能够第一时间分享学者们的最新成果，但实际上它与论文的筛选与评比还是有不同的。本次圆桌上同样提及了这个问题，那么学者们都持什么样的观点呢？

几位老师的观点整体上比较一致，都认为 arXiv 作为一种交流工具，在学术领域还是起到了积极作用，但需要防止占坑现象的发生；此外，作为读者也应当仔细甄别，避免被误导的倾向。这与 AI 科技评论在征询其它老师们所得到的结论是相同的。

讨论点三：在视觉领域领域，如何设计基于强化学习的奖励函数？

罗翀老师提及，强化学习通过设置奖励函数，可以使算法的表现越来越好。如果我们也想用同样的方式训练计算机视觉的检测、分割与视频捕捉，其中的机制应当如何设计？

「如果要想拿视觉做一个类似于 AlphaGo 的评价函数，那么它不是单独视觉能解决的，而是需要把视觉能力的评估（Assessment）融入到一个智能系统中，然后由这个系统给出奖励或惩罚，甚至于给一个群体之间的反馈。这样的评价函数是可以做的，但它不是单独来自于计算机视觉的。」陈熙霖博士如是说，这个观点与齐国君教授的想法不谋而合，后者也认为视觉绝对不是一个单一系统，他表示可参考边学习边生成样本的方法（借助 GAN 或游戏的方法）来学习新的信息，产生一个闭环。

曾文军博士则提及了微软亚洲研究院机器学习组去年 NIPS 时的一个工作——对偶学习（ AI 科技评论按：关于对偶学习，雷锋网邀请到了微软亚洲研究院主管研究员秦涛博士给我们做了一次硬创公开课《对偶学习的对称之美》），他表示这个同样是基于闭环的原理而进行学习的。

讨论点四：CVPR 于华人研究者

与 AAAI 2017 的论文投递情况一样，今年 CVPR 2017 华人同样占据了越来越多的份额，但华人论文在学术会议中的占比提升，却并没有很多令全球学术圈印象深刻的研究工作。

关于这一点，数位研究者们都认为，重点还是要关注研究工作的价值与影响力，而不仅仅停留在数目和入选率上。此外，林宙辰教授还指出，学者除了发表论文外，也应该积极参与交流，成为制定领域规则的主导者、发声者。

讨论点五：在深度学习的影响下，如何让计算机视觉社群独立发展？

正如王蕴红教授所提及的，「计算机视觉的传统问题依然存在，机器学习只解决了一部分，但是有很多问题还依然没有解决。」而曾文军博士也表示，只靠现有的深度学习，还有很多无法解释的东西（如黑箱问题等）。因此需要采用传统的自上而下的方法，加上知识图谱与逻辑内容，才有可能解决实际问题。

林宙辰教授表示，机器学习与计算机视觉相比，对特征的获取并不关心，而这正是后者所具备且着重研究的。此外，「有很多地方，计算机视觉会有它的独特之处。像立体视觉就需要基于一定的物理模型，所以我们不是简单地做一些端到端的东西就可以了。这两个领域的融合是『自古以来』就有的，并不是新产生的现象。」

而齐国君教授则指出，机器学习和计算机视觉并不是对立的竞争关系，更应该是一种依存与促进的关系。「机器学习在很多领域都有应用，但我觉得其中最成功、最有影响力的应用还是在计算机视觉，包括一系列的方法，比如深度学习中的卷积神经网络，这是一个纯粹的视觉问题，后来才引申出一系列新的应用领域。」

更多关于「微软亚洲研究院创研论坛——CVPR 2017 论文分享会」的精彩内容，欢迎观看直播回放。

地址：http://www.xuetangx.com/event/cvpr2017

6月22日门票直减 750 优惠券

手慢过期

https://gair.leiphone.com/gair/coupon/s/594b4eda20d62

优惠券仅限「参会门票」。赠送的优惠劵额度每天递减 50 元，有效期为 1 天，可供多人使用。长按复制链接在浏览器打开，或点击文末阅读原文立即使用。

点击文末阅读原文立即使用

AI科技评论招人啦！

作为国内顶尖人工智能学术媒体，AI科技评论一直秉承“洞悉学术前沿，连结产业未来”的理念，为读者奉上来自国内外的深度报道。

AI科技评论期待你的加入，和我们一起见证未来！现诚招学术主编（外聘）、学术编辑、外翻编辑等岗位，详情请 点这里

欢迎投递简历到：guoyixin@leiphone.com，AI 科技评论等你哦！

登录查看更多

相关内容

王蕴红

关注 0

王蕴红，北京航空航天大学计算机学院副院长，中国计算机学会理事，中国人工智能学会、图象图形学会常务理事，中国人工智能学会智能交互专业委员会主任，计算机学会推荐的A类学术期刊IEEE Transactions on Information Forensics and Security编委，IEEE Senior Member。在模式识别与图像理解方面进行了深入研究，在人脸识别、步态识别、虹膜识别、物体识别、信息隐藏检测方面的成果被广泛引用。作为负责人已主持国家级自然科学基金、863项目、973课题16项。虹膜识别的文章被评为《自动化学报》50年来最具影响力论文。在IEEE Transactions on PAMI等权威国内外学术期刊和国际会议发表学术论文200余篇，发表论文被Google Scholar引用9千余次，获得授权国家专利14项。2005年入选教育部新世纪优秀人才，曾获国家技术发明二等奖、北京市科学技术奖一等奖，2013年获得中国青年科技奖。个人主页：http://people.ucas.ac.cn/~0013601

【CCF计算机视觉专委会】未来5-10年计算机视觉发展趋势，

专知会员服务

104+阅读 · 2020年5月20日

【经典】《上海交通大学生存手册》，一本让你在大学活出精彩的秘籍

专知会员服务

203+阅读 · 2020年4月18日

【经典】论文是怎样炼成的，108页PPT教你研究生毕业通关秘籍

专知会员服务

138+阅读 · 2020年3月21日

2019中国硬科技发展白皮书 193页

专知会员服务

86+阅读 · 2019年12月13日