数据院科技大数据研究中心发布半世纪全球顶级学者迁移图(附视频、亿级学术信息)

2017 年 11 月 4 日 THU数据派

来源:新智元

作者:闻菲,刘小芹

本文长度为3000字,建议阅读7分钟

本文介绍了科技情报挖掘系统AMiner对半个世纪以来的顶级研究者的迁徙的研究。


[ 导读 ] 2017机器智能前沿论坛今日在中国工程院报告厅成功举办。清华大学计算机系副教授唐杰发表主题演讲,并为大家介绍了数据科学研究院AMiner团队自主研发的研究者社会网络挖掘与搜索系统——AMiner及近期研究成果。


提到AMiner能够做什么,他举例:阿里巴巴一直关注AI领域,包括今年建立达摩院,非常需要引进相关人才,针对这一方面阿里巴巴与AMiner达成合作。AMiner系统可以通过对AI做领域梳理划分,再分析各细分领域的专家信息,最终实现精准学术画像,为阿里提供人才信息。唐杰老师还提到了包含亿级学术信息,并自动分析关联的开放知识图谱,可供大家用于研究。


开放知识图谱地址:https://aminer.org/open-academic-graph



随后,唐杰老师为大家展示了AMiner团队发布的半个世纪以来顶级学者迁徙视频,这是AMiner在对全球 1.3亿研究者进行精准画像的基础上做出来的研究者生涯职业变化图。这个视频包括了全球10,000名顶级研究者(根据发表论文引用计算的个人h-index最高的研究者)的职业地理位置迁移图。


从MS-DOS发明、第一个个人数字助理,到第一台iPhone,用基因方法修改人类胚胎,伴随人才的流动,展现科技发展图景。从图中可以清晰的看到在过去50年,人才从欧洲到美国、从美国东海岸到西海岸、从美国到中国的流动,以及更加全球化的变化。

 


仔细查看,还可以看出上世纪70年代整个亚洲的顶级人才都相对较少,少数集中在以色列、日本,印度和澳大利亚也有一些;到80年代中叶,中国开始有吸引了少量顶级学者(大多是顶级华裔学者回归),但全球这个时候的顶尖人才大多分布在美国(尤其是东海岸)、英国和西欧,回归国内的学者主要集中在北京、上海和南京;到90年的时候,中国顶尖人才数量在亚洲已经超过印度,而且分布也更广,不再仅仅局限于北上广,但数量上总体还不及日本;到2000年以后中国和欧美的交流大大增强,回归国内的全球顶尖学者也大大增加,而且很多顶尖学者开始回到内地,这个时期香港的发展达到顶峰;最近几年这个趋势得到进一步增强。从到目前为止的分布来看,全球顶尖学者更多的还是在美国和欧洲,但中国乃至亚洲都得到极大的发展。


另外,该视频还展示了每年最重大的科技实践,包括从计算机的出现和发展、互联网的萌芽、全球信息化的开始、互联网的普及、移动互联网的兴起等科技大事件。

 

这个工作的难点包括两个,一个是数据缺失,很多研究者的信息缺失,很难拿到所有学者每年的职业变化信息,我们使用机器学习算法自动对缺失数据进行补全。另一个难点是很多人的名字存在重名现象,我们设计了一个高效的命名排歧算法,并对识别出来的职业信息进行平滑化,自动纠正了大量识别错误,通过这两个方面的优化,目前自动识别精度达到90%以上。

 

除此之外,AMiner团队得到了几个有意思的结果。一是欧美之间保持着非常活跃的学术交流。“我们直觉上认为,进入21世纪后,中美两国在学术上更加活跃,尤其是在计算机科学领域,”唐杰说:“从文章发表数量上看,欧洲相对来说没有那么多。”但实际上,根据这次半世纪人才迁移调查,团队发现欧美之间学术交流仍然保持在一个非常高的水平。

 

其次,中国仍然处于顶级学术起步阶段。“最近中国的强势表现让我们有一种‘中国已经成为学术中心’的错觉,”唐杰说,实际上我们才刚刚起步,仍有很长的路要走。

 

再来是在计算机科学领域,很多人可能会以为谷歌、Facebook等大公司所在的硅谷是CS活跃地区,但实际上美国东部,有CMU、MIT所在的学术重镇,其实力和影响力都非常惊人。

 

唐杰告诉新智元,这次的数据只是一个初步的展示,包括了各个学科及领域的人才流动情况。接下来AMiner团队将会发布的版本计划增添新的功能,包括让用户能够指定学科和领域(比如AI),搜索该分类的人才流动情况。


来自AMiner的最新更新,唐杰教授4日在微博上发消息说:给大家分享一个AMiner自动生成的技术趋势预测“人工智能”,可以自动发现子领域;分析近期热度、全局热度;可以追溯技术源头;可以发现每个子领域历史来重要人物。


AMiner团队将不断的推出更多科技大数据的深度洞察报告和情报分析结果,让您“洞察科技,把握趋势”


这还只是预览版,不久后将有更完善版本发布:



此前,AMiner曾经绘制过一副AI历史图,标出了AI历史节点上的关键概念和人物:


(点击图片查看高清大图)



以下就是AMiner团队“半世纪全球顶级学者迁移图”的调查结果。每张图中的蓝色线条表示顶级人才的迁移情况(视频中能够看到流动方向)。

 

每一年,团队都选择了代表性的人物和/或事件。这个选择的标准是根据当年论文的引用情况、著名的学术获奖(比如诺贝尔奖)等多项指标进行的排名。



1978

 


  • 路易丝·布朗(Louise Brown)出生,成为第一名通过体外受精技术出生的试管婴儿。Robert K.Jarvik发明的人工心脏Jarvik-7。

 

1979

 


  • 手机发明


  • Seymour Cray发明Cray超级计算机

 

1980



  • 阿兰·古斯(Alan Guth)提出宇宙暴胀模型

 

1981



  • MS-DOS发明


  • 第一台IBM-PC发明


  • Gerd Karl Binnig 和 Heinrich Rohrer 发明的扫描隧道显微镜

 

1982



  • 理查德·费曼(Richard Feynman)提出可模拟任何物理对象的通用量子模拟器


  • 人类生长激素基因工程。


  • 索尼和飞利浦合作发明CD(光盘)

 

1983

 


  • Kary Banks Mullis 发明用于DNA测序的聚合酶链式反应(PCR)


  • Apple Lisa 个人电脑发明


  • Jaron Lanier 首词提出术语“虚拟现实”

 

1984

 


  • Psion 开发第一个个人数字助理


  • Barry Marshall 和 Robin Warren 证明溃疡是由细菌引起的

 

1985

 


  • 微软开发 Windows 程序


  • David Deutsch 提出通用量子计算机

 

1986

 


  • 苏联发射永久空间站MIR


  • Karl Muller 和 Johannes Bednorz 发现第一种高温超导体

 

1987

 


  • Applied Biosystems 推出了第一台全自动测序仪


  • 第一个3D视频游戏诞生

 

1988

 


  • 数字蜂窝电话发明


  • 克里斯蒂安·多普勒(Christian Andreas Doppler)发明多普勒雷达


  • 第一项遗传工程的动物专利被授予哈佛大学研究人员Philip Leder和 Timothy Stewart的“哈佛鼠”。

 

1989



  • 高清电视发明


  • 康奈尔大学学生罗伯特·泰潘·莫里斯( Robert Tappan Morris)由于散布蠕虫病毒,成为第一个根据1986美国“计算机欺诈和滥用法案”被起诉的人


  • 赤崎勇(Isamu Akasaki)发明蓝色发光二极管

 

1990

 


  • 哈勃望远镜发射


  • 第一个互联网搜索引擎“Archie”出现


  • Tim Berners-Lee 发明万维网WWW、Internet协议(HTTP)和WWW语言(HTML)


  • 威廉·弗伦奇·安德森(William French Anderson)完成第一例基因治疗手术

 

1991



  • 第一个网站在CERN上线


  • Qiudong Wang 为n体问题提出解决方案


  • Nicola Pellow 推出第一个跨平台网络浏览器 Line Mode Browser


  • 数字电话答录机发明

 

1992



  • Calgene创造“Flavr Savr”番茄,这是第一个在商店销售的基因工程食品


  • 手机发送了的第一条短信(SMS)


  • SOCKS互联网协议公开

 

1993

 


  • Gerard't Hooft 提出全息理论


  • Pentium 处理器发明


  • William Wootters等人发现如何用纠缠实现量子传送

 

1994



  • HIV蛋白酶抑制剂发明


  • Netscape 启动 Netscape Navigator Web浏览器,创建HTTP Secure


  • 高亮度蓝光LED发明,发明者在2014年获得诺贝尔奖


1995



  • Java计算机语言被发明


  • DVD发明


  • 顶夸克(top quark)终于在费米实验室被发现

 

1996

 


  • 诺基亚推出了第一款“智能手机”


  • Giacomo Rizzolatti 发现大脑使用“镜像”神经元来表达别人在做的事情

 

1997

 


  • Ian Wilmut 克隆了第一只哺乳动物,绵羊多莉


  • 第一台漫游器机器人“火星探路者”登陆火星


  • 丰田开始销售混合动力车普锐斯(Prius)

 

1998

 


  • Saul Perlmutter,Brian Schmidt 和 Adam Riess 发现宇宙的扩张正在加速(暗能量)


  • Juan Maldacena提出全息宇宙理论


  • James Thomson 等人培养人类胚胎干细胞

 

1999

 


  • 第一个社交网络平台Friendster由Jonathan Abrams发布


  • Tekno Bubbles 获得专利


  • John Pendry 发现创造超材料的方法


2000 



  • FluidSense 输液泵发明(自动标准化静脉给药)


  • Tau中微子由DONUT协作发现

 

2001

 


  • 第一版人类基因组计划发表


  • AbioCor 发明AbioCor人工心脏


  • 人造肝脏由 Kenneth Matsumura 和 Alin Foundation发明


  • 2001年10月23日,苹果公司发布便携式音乐数字播放器的iPod

 

2002

 


  • James Auger 和 Jimmy Loizeau 发明植入芯片的牙齿


  • Nano-tex LLC 发明纳米可穿戴织物Nano-tex


  • Sanford Ponder发明ICOPOD

 

2003

 


  • 格里戈里·佩雷尔曼提出庞加莱猜想的证明


  • 人类基因组计划完成,确定了人类DNA中的所有基因

 

2004



  • NASA确认火星存在液态水


  • 发现双脉冲星


  • Andre Geim 和 Konstantin Novoselov 成功分离出单层石墨烯。

 

2005



  • Edvard Moser 和 May-Britt Moser 发现大脑中的网格细胞


  • 第一个视频被上传到在线视频托管服务YouTube


  • 在卡特里娜飓风之后,新奥尔良地区的堤坝被毁坏。

 

2006

 


  • 社交网络服务Twitter出现


  • Paul Rothemund 发明DNA折纸


  • 美国威克森林浸会医学中心的Anthony Atala和团队成功将第一批实验室培育的膀胱移植到人类患者中


2007



  • 史蒂夫·乔布斯发布苹果公司的第一款iPhone智能手机


  • 中国月球探测计划的第一颗卫星嫦娥1号发射升空


  • Knome 首次尝试将人类基因组测序商业化

 

2008




  • 比特币首先在一个密码学网站的邮件组列表被描述


  • “神舟7号”发射,这是中国太空计划的第三个载人航天器

  • CERN大型强子对撞机(LHC)开始质子团队测试

 

2009



  • Yinfa Ma  博士开发了一种使用尿样进行检测的癌前筛查方法


  • 两队中国研究人员从诱导性多能干细胞(iPS)细胞中产生活小鼠


  • 亚利桑那州立大学的研究人员Hao Yan和Yan Liu使用纳米粒子制作3D DNA纳米管

 

2010

 


  • 自动驾驶汽车从意大利行驶13000公里来到中国,是自动驾驶汽车的第一次洲际之旅


  • 2010年5月20日:Craig Venter领导的科学家创造出首个合成基因组细胞


  • 科学家成功实现老鼠“逆生长”

 

2011

 


  • 中国科学家计算出蛋白质折叠的量子定律,解释了温度对折叠的影响


  • 航天飞机计划STS-135的最后任务是在亚历山大号航天飞机在肯尼迪航天中心着陆


  • 美国宇航局成功建立了火星科学实验室,该实验室曾成功实现好奇火星车的着陆


2012



  • Jennifer Doudna 的小组发明了用于基因编辑的 CRISPR-cas9 系统


  • 希格斯玻色子在CERN被发现(确认为99.999%的确定性)


  • 在麻省理工学院发现了光子分子


  • 京都大学Kiyotaka Miura发明了可以容纳数百万年数据的石英玻璃存储器

 

2013

 


  • 第一种可植入癌症疫苗,结合了最新的癌症免疫学与材料科学,在2013年进入临床试验


  • 科学家成功制造各种迷你器官


  • 科学家通过克隆创造了人类干细胞

 

2014

 



  • 欧洲航天局设计的罗塞塔航天器包括了美国宇航局的特殊仪器,并将其220磅重的菲莱登陆者登陆彗星67P / Churyumov-Gerasimenko


  • Lockheed Martin宣布,他们在核聚变领域取得了巨大的技术突破

 

2015



  • 火星上发现液态水痕迹


  • Junjiu Huang 用基因方法修改人类胚胎


视频链接:

https://static.aminer.org/lab-datasets/trajectory/top10000career-trajectory.mp4


了解更多:

https://aminer.org/


登录查看更多
0

相关内容

唐杰,清华大学计算机系教授、系副主任,获杰青。研究兴趣包括:数据挖掘、社交网络和知识图谱。发表论文200余篇,引用10000余次(个人h-指数57)。主持研发了研究者社会网络挖掘系统AMiner,吸引了220个国家/地区1000多万独立IP访问。曾担任国际期刊ACM TKDD的执行主编和国际会议CIKM’16、WSDM’15的PC Chair、KDD’18大会副主席。作为第1完成人获北京市科技进步一等奖、中国人工智能学会科技进步一等奖、KDD杰出贡献奖。
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
重磅发布|《全球机器人报告2019》出炉!附全文下载
机器人大讲堂
7+阅读 · 2019年9月28日
解读《中国新一代人工智能发展报告2019》
走向智能论坛
32+阅读 · 2019年6月5日
中国工程院:《全球工程前沿2018》(附PDF下载)
走向智能论坛
10+阅读 · 2018年12月5日
AMiner权威发布Robotics人才库
THU数据派
6+阅读 · 2018年3月26日
A Survey on Edge Intelligence
Arxiv
49+阅读 · 2020年3月26日
Arxiv
99+阅读 · 2020年3月4日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
13+阅读 · 2018年12月6日
VIP会员
相关VIP内容
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
Top
微信扫码咨询专知VIP会员