王鹏帅:从清华到微软,科研需要创造力

2022 年 4 月 26 日 学术头条


今年 1 月,AMiner 团队推出 AI 2000 榜单,旨在通过 AMiner 学术数据在全球范围内遴选过去十年间,人工智能学科最有影响力、最具活力的顶级学者,标榜他们对于人工智能研究领域的卓越贡献。本次学术头条有幸对入围这一名单的微软研究员王鹏帅进行了采访。


本科清华、保研,仅是这两个标签,王鹏帅的学霸形象已经跃然纸上。在神仙打架的顶尖学府中,他更是直博进入清华大学高等研究院。不到十年,从刚入大学的愣头青到崭露头角的科研新星,再到进入微软亚洲研究院,王鹏帅一路“升级打怪”,不断成就自我。


学霸养成第一步:苦其心志

每个人的成长都有自己的时区,而王鹏帅的时区,一向比多数同龄人走得更快。
 
2009 年进入清华读本科,2013 年拿到保研资格后,他锁定了久负盛名的清华高等研究院(后文简称高研院),当时高研院正招收计算机方向的博士生,主攻计算机图形学与计算机视觉研究。但只是一名本科生的王鹏帅,能顺利通过面试,成功拿到直博资格吗?

王鹏帅坦言,其实当时自己并没有想太多,只是觉得既然有这么一个机会,何妨一试?更何况自己已经坚定继续在学术道路上深耕,高研院也是心中向往所在。于是,凭借扎实的知识基础和优异的成绩,他顺利进入高研院,从此开启了计算机图形学研究的第一步。
 
时间齿轮转动不停,2018 年博士毕业,王鹏帅正式进入微软亚洲研究院,继续“揭秘”三维图像的分析与构建。这一切看似水到渠成,但他笑着说:“或许看起来我前行的速度还算快,但实际上,我的钟表也有走得很慢的时候。”
 
博士第一年,王鹏帅就敏锐地觉察到与本科学习的天差地别。“本科时主要的任务是掌握知识,所学的东西都是已知的、现有的,突然到博士之后,是要去探索学术前沿,探索未知的东西。”尽管本科期间,他也参与过实验室项目,积累了一定的科研经验,但博士期间,如何得到创新型产出才是最能体现价值所在的东西。
 
这时,王鹏帅深感自己的时区似乎跟不上别人了:“看到周围的同学都有非常高质量的论文产出,而我直到博二上学期,都还没有论文发表。当时内心其实非常着急甚至焦虑起来。”
 
即使是常人眼中的大学霸,也有晚上睡不着、稍有噪音就惊醒的煎熬时光。但不怕困难的精神始终在潜意识中支撑着他,很快,他认识到问题的关键,并非在于“是否有论文发表”这一结果,而在于“是否做好了手头上的课题”这一过程。
 
同时,他也感谢当时老师们对自己的开导和帮助。“老师们给了我很多信心,比如在选题、课题的研究方向以及做实验方面都给予了非常细致的指导,这让我更加坚信,高质量的付出最终一定会有收获。”量变终会达成质变——2015 年,王鹏帅的一篇论文完成,并顺利发表在了计算机图形学顶级期刊 ACM Transactions on Graphics 上。
 
对于这段不太顺利的时光,他有很大感悟:“刚入学时面临从输入到产出的转变,这应该是很多博士生都会有的烦恼。不过我相信,焦虑是思想层面的,只要尽量不让其影响行动层面,那么最后你的行动是可以反过来影响思想的。”
 

学霸养成第二步:为科研魅力所折服

科研路上,困难只是小小插曲,对王鹏帅来说,更多的是对专业魅力的沉醉。谈起自己印象最深刻的一项工作,他语气更加活跃,似乎透过侃侃而谈的声音,都能看见一双饱含活力的眼睛。
 
那是他在博士期间所做的一项有关三维形状分析的研究。2012 年,卷积神经网络(CNN)在二维图像理解上的应用引爆了计算机视觉领域,人们的目光被这样一种高效的计算机模型深深吸引。然而,CNN 虽然在二维图像上表现极好,当被应用于三维形状时却困难重重。
 
三维形状有很多种表达,比如点云、三角形网格、三维体素等。其中体素表达和二维图像在概念上最接近,因此将 CNN 推广到三维的一种最直接的方法是将卷积运算作用在三维体素上。然而这一方法的内存和时间开销却非常大,因为假如一张二维图片的分辨率为N,其像素数量大概是 N2,而若是三维体素表达的形状,体素数量会暴涨为 N3。
 
而经过不断探索与观察,王鹏帅团队发现,三维形状在本质上还是二维的。例如当车载雷达扫描到行车或行人时,实际上生成的点云并未将三维空间占满,仅仅占用三维空间中的某个曲面,三维空间的绝大部分区域都是空的,这就是三维数据的稀疏性。
 
基于这一观察,他们创造性地提出了三维稀疏卷积,即将神经网络的运算和存储限制到稀疏的非零信号上,而对于三维空间中信号为零的区域(即空的区域),其卷积运算被直接忽略,因此极大地改善了神经网络运行的内存和时间开销。为了在 GPU 上高效地实现稀疏卷积,他们采用了图形学中经典的八叉树的数据结构来高效地组织稀疏的非零信号。这就是他们提出的基于八叉树的稀疏卷积神经网络(O-CNN)。
 
在输入分辨率比较高的时候,相对于基于体素的三维 CNN,该方法在内存时间效率上都达到了上百倍的提升。而且王鹏帅提到,稀疏卷积的概念被广泛应用到各种三维分析任务中,直到现在,O-CNN 在大型数据集上(比如 ScanNet)也能够取得非常顶尖的性能。

图 | 王鹏帅团队提出的基于八叉树的稀疏卷积神经网络(O-CNN)图示:用八叉树表示输入形状,并将三维 CNN 的运算和存储限制到八叉树节点上,即非零信号上。

 
现在,他继续在该领域深耕:“三维数据的表达非常丰富,导致现在为止还没有一个通用的神经网络框架,所以我希望能够继续把我们的方法加以完善,最后找到一种通用的方法,能够同时处理不同表达的三维数据,而且能够应用于不同的任务,例如分析、生成甚至仿真任务。”
 
听到此处,小编不禁好奇:究竟是什么让王老师对科研保持如此热忱呢?
 
他回答说:“可以说从本科开始,我就常常想,要成为一个有用的人才,为国家或者说为社会做贡献。选择科研这条道路时,我更希望能够做出一些有影响力的研究,当看到这些成果真的能够推动某个领域的发展,这也是实现自我价值、为国家和社会做贡献的一种方式吧!”
 

学霸养成第三步:自由、深度、创造力

电影中塑造的计算机科研人员,要么看起来“生人勿近”,要么有手指在键盘上飞舞的“狂拽酷炸”。当被问道这样的形象时,王鹏帅有些哭笑不得:“其实无论是在学校还是进入工作,我们都是纯粹地做研究的状态。”
 
对于科研人员做好研究的关键,他认为主要有三点:好的环境,培养创造力,和保持好奇心。
 
他首先分享了一个小故事:曾经在高研院的一位物理专业同学在攻读物理博士一年后,发现对计算机方向很感兴趣,与老师们沟通后,都很支持他转到了计算机方向,后来这位同学也做出很多优秀的成果。
 
“无论是在清华高研院还是在微软,我都感激大家创造了一种开放自由且激励人的研究环境,我觉得这是非常难能可贵的。”
 
目前,王鹏帅也指导着同门师弟在微软进行实习,他经常和师弟分享经验——做研究需要关注深度。每个人的精力都是有限的,在刚开始做科研的阶段,更应该抓住一个关键点不断深挖,达到连点成线的效果。
 
第三点就是科研人员的创造力非常重要。诚然,要想做出好的研究和成果,付出大量时间和努力是必须的。但王鹏帅也有自己的小妙招:时间投入不一定局限于坐在工位上,他经常将论文打印出来带在身上,无论是吃饭、锻炼还是坐车的空隙,都会拿出论文读一读,或是不断地思考问题。
 
他相信:“凡是想要做出一番成绩的人,在时间上的付出不可能很短,而且更多时候付出的都是隐性时间。”
 
至此,“学霸养成三部曲”告一段落,你学会了吗?

个人简介:
王鹏帅,2018 年 7 月于清华大学高等研究院获工学博士学位,随后加入微软亚洲研究院。研究方向为计算机图形学、基于数据驱动的三维几何数据的处理与分析。目前以第一作者身份在 SIGGRAPHSIGGRAPH ASIA 上发表论文 5 篇。他的基于八叉树的稀疏卷积(O-CNN)的论文是在近五年按来所有发表在SIGGRAPH(ASIA)的论文中引用量排名前五。他曾多次获得清华大学奖学金、博士研究生国家奖学金,并于 2018 年获得北京市优秀博士毕业生。


l 个人主页:
https://www.aminer.cn/profile/pengshuai-wang/542db030dabfae489b98945f
https://wang-ps.github.io/
l 所属实验室必读论文:
https://www.aminer.cn/topic/625fb2367376380a6a628eca
 
AI 2000 榜单介绍:
AI 2000 榜单由清华大学 AMiner 联合北京智源研究院、清华-中国工程院知识智能联合研究中心共同发布,旨在通过 AMiner 学术数据在全球范围内遴选过去十年人工智能学科最有影响力、最具活力的顶级学者。榜单评选基于 2012-2021 十年间人工智能领域 49 家顶级期刊会议收录的共计 178,254 篇论文、204483 位作者的大数据,采用智能算法自动化生成榜单,得到 200 位“AI 2000 最具影响力学者奖”以及 1800 位“AI 2000 最具影响力学者提名奖”。
 
点击文末【阅读原文】了解更多关于 AI 2000 榜单的完整内容

点这里关注我👇记得标星~




热门视频推荐

更多精彩视频,欢迎关注学术头条视频


# 往期推荐 #


winter

【学术头条】持续招募中,期待有志之士的加入

强势招募兼职作者!邀你书写前沿科技内容

2021-12-21

 

登录查看更多
0

相关内容

2000~2011年在北京航空航天大学自动化科学与电气工程学院学习并获得学士和博士学位,博士毕业后先后在北京富士通研发中心(约1年)和阿德莱德大学计算机学院(约4年)从事科研工作,2017年入选中组部“青年千人”计划并于同年加入西北工业大学计算机学院任教授博导。主要从事计算机视觉、机器学习与人工智能等领域的研究工作。在TPAMI、IJCV、CVPR、ICCV、ECCV、AAAI、IJCAI等计算机数据和模式识别领域期刊和会议上发表一系列学术论文。中国模式识别与计算机视觉大会(PRCV2019)组织委员会主席。CCF YOCSEF西安副主席。
如何自学CS?北大信科《计算机自学指南》为您呈送宝典
专知会员服务
71+阅读 · 2021年12月14日
清华大学黄民烈:本科生如何做出好的科研
专知会员服务
46+阅读 · 2021年11月26日
专知会员服务
47+阅读 · 2021年5月21日
一份硬核计算机科学CS自学修炼计划
专知会员服务
40+阅读 · 2021年1月12日
清华大学《人工智能》书籍教学课件开放下载
专知会员服务
137+阅读 · 2020年7月27日
丘成桐已全职加入清华
量子位
0+阅读 · 2022年4月21日
一个寒门学子十多年走过来的科研路
极市平台
0+阅读 · 2022年4月1日
致敬科技女性|AI力量,听她们说!
极市平台
1+阅读 · 2022年3月8日
她们非同凡响的“另一面”
微软研究院AI头条
0+阅读 · 2022年3月8日
萌屋会 | 卖萌屋作者们都是如何选择科研方向的?
夕小瑶的卖萌屋
0+阅读 · 2022年3月3日
自动化所举行2021届研究生毕业典礼暨学位授予仪式
中国科学院自动化研究所
0+阅读 · 2021年6月23日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年7月12日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年6月22日
Arxiv
0+阅读 · 2022年6月17日
Arxiv
24+阅读 · 2022年1月3日
Arxiv
58+阅读 · 2021年11月15日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
Anomalous Instance Detection in Deep Learning: A Survey
VIP会员
相关VIP内容
如何自学CS?北大信科《计算机自学指南》为您呈送宝典
专知会员服务
71+阅读 · 2021年12月14日
清华大学黄民烈:本科生如何做出好的科研
专知会员服务
46+阅读 · 2021年11月26日
专知会员服务
47+阅读 · 2021年5月21日
一份硬核计算机科学CS自学修炼计划
专知会员服务
40+阅读 · 2021年1月12日
清华大学《人工智能》书籍教学课件开放下载
专知会员服务
137+阅读 · 2020年7月27日
相关资讯
丘成桐已全职加入清华
量子位
0+阅读 · 2022年4月21日
一个寒门学子十多年走过来的科研路
极市平台
0+阅读 · 2022年4月1日
致敬科技女性|AI力量,听她们说!
极市平台
1+阅读 · 2022年3月8日
她们非同凡响的“另一面”
微软研究院AI头条
0+阅读 · 2022年3月8日
萌屋会 | 卖萌屋作者们都是如何选择科研方向的?
夕小瑶的卖萌屋
0+阅读 · 2022年3月3日
自动化所举行2021届研究生毕业典礼暨学位授予仪式
中国科学院自动化研究所
0+阅读 · 2021年6月23日
相关基金
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年7月12日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年6月22日
Arxiv
0+阅读 · 2022年6月17日
Arxiv
24+阅读 · 2022年1月3日
Arxiv
58+阅读 · 2021年11月15日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
Anomalous Instance Detection in Deep Learning: A Survey
Top
微信扫码咨询专知VIP会员