一张通往宇宙奥秘的地图

2017 年 12 月 31 日 科学出版社 George、Knegjens

科学家生活在一个快节奏的世界,在这个世界里,每天都有数百篇新的论文出现,每一篇都是数月甚至数年累积的辛勤工作才获得的研究成果。面对如此巨大的论文信息量,如果能发明一种新的组织归类方式,让科研工作者更轻松的发现那些可能错过的好论文、也让刚进入领域的新人找到开始的方向,那可真能算得上是功德无量的好事一件了。


ArXiv是一个几乎每位科研工作者都熟悉的开放式的网站。科学家通过在arXiv发表论文的预印本,能迅速被别人访问阅读。自1991年起,arXiv 已经聚集了物理、数学、计算机科学、统计学、定量生物学和金融学等领域的一百多万篇论文。每个工作日几乎都会增加数百篇新的研究论文,包括从希格斯玻色子到量子隐形传态,再到恒星的形成等各个学科。




尽管大部分学科间的区别都很明显,但还是有许多交叉学科的成果是从完全不同的领域中提取的,因此建立一个能够可视化整个领域的“地图” 应该挺有意思,有点像六度分隔理论,但是是存在于学术论文之间的。


如果你请一位科学家,让他把 arXiv 上自己的研究领域(比如黑洞或者量子隐形传送)的文章归类组合在一起,他很有可能能胜任这项工作并制作出一张非常棒的“地图”,但完成这项任务所需要的时间必定很长。因此,Damien George 和 Rob Knegjens 决定让计算机来完成这个使命。


科学论文有着非常适合自动绘制成地图的内在逻辑结构:在论文的参考文献部分列出的其他论文,一般都有着相同或是相关的主题。因此那些互相引用的论文就可以被放在一起,而缺少这种链接的论文或许就没有被归在一起的必要。George和Knegjens采用了一种平时用来模拟星系形成的算法,来完成这项归类工作,用论文取代模型中的恒星,将引力间的相互吸引转化成一种互相排斥的反重力,让学术论文散布在整个视野中。


这个在线地图被命名为“Paperscape”。每个圆圈代表一篇科研论文,圆圈的面积与论文被引用的次数成正比。不同类别的论文(如物理学、数学、计算机科学等)有着不同的填充颜色。


○ Paperscape是基于arXiv的论文库绘制的可视化地图,每个圆圈代表一篇论文。截止2017年12月8日,图中包含了1330216篇论文。| 图片来源:Damien George 和 Rob Knegjens


有意思的是,高能理论物理学(hep-th,大片的蓝色区域)位处地图的中央。这一部分的理论物理奠定了许多基础物理学的根基,因此它将许多学科如高能物理现象学(实验结果的预测和研究)、天体物理学凝聚态物理学量子物理学以及数学的部分领域连接到一起。然而,身处地图的中心也伴随着一些缺点。由于理论物理学之间的交织十分紧密,因此不同于其他领域的分类,它很难被分离出单独的子课题。


○ 不同颜色代表不同的领域。中央的蓝色是高能理论物理学(hep-th),它连接了天体物理学(astro-ph)、高能物理现象学(hep-ph)、凝聚态物理(cond-mat)、量子物理学(quant-ph)和数学(math)。| 图片来源:Damien George 和 Rob Knegjens


另一个有趣的点是色块之间的连接区域,也就能找到交叉学科论文的区域。例如,天体物理学(astro-ph)和理论高能物理学(hep-th)之间的联系有着暴胀暗能量等课题的研究。这两个课题都需要天体物理学方面的技术,如宇宙微波背景的测量,配合以详细的理论计算,因此地图中显示出大量的色块重叠。


○ 交叉学科。图中显示了暴胀(Inflation)、暗能量(dark energy)、宇宙微波背景(cosmic microwave background)等领域。| 图片来源:Damien George 和 Rob Knegjens


在天体物理学和高能物理现象学(hep-ph)之间还存在一片暗物质领域。暗物质可以解释为什么宇宙具有我们今天所看到的结构,以及为何星系的旋转速度比预期的要快。它将与星系和宇宙的历史测量相关的天体物理学,以及试图从高能对撞实验(如CERN的大型强子对撞机)中可能检测到新的基本粒子来解释暗物质的高能物理现象学结合到一起。


George 和 Knegjens 还设计了一个替代的着色方案,不按照研究领域分类,而是根据论文已被发表的时长进行描绘。这让人们可以通过寻找明亮的红色区域,轻松地找到特定地区的“热门话题”。


○ 越红代表论文发表的时间越新。| 图片来源:Damien George和Rob Knegjens


能够从一张图中看到整个 arXiv 的感觉很棒,因为这样能让你知道你没有错过任何重要的东西。George 和 Knegjens 希望这张 Paperscape 能使 arXiv 不再那么让人望而却步,尤其是对刚进入研究领域的学生来说;而对于经验丰富的资深学者而言,Paperscape 或许有助于他们在自己领域之外进行更有效的阅读,因为在 Paperscape 上,任何重要论文和热门话题的搜寻都非常容易。


○ 随意点击图中的圆圈就会在右上角显示该论文的信息,包括作者、发表时间、被引用次数等,访问者可以点击pdf进行阅读。| 图片来源:Damien George和Rob Knegjens


Paperscape 还有一些附加功能,例如使用者可以用“标签”来分类 arXiv 的论文,并与其他人分享自己的论文合集。在这几年间,更多方便实用的功能也在不断被更新。2014年,Paperscape 添加了一个弹出框,不仅让论文搜索变得更容易,还能将论文的搜索范围精确到特定的提交日期范围。2015年年初,基于 Paperscape 浏览器的地图客户端的源代码被发布在了Github上。至2016年底,Paperscape 更新了从1991年到2015年年底 arXiv 上的图形数据,在地图客户端添加了“点击搜索作者”功能,并且优化了热图的颜色方案等等。


基于庞大的论文库 arXiv,Paperscape为进入这个奇妙的学术世界提供了一个美丽的窗口,希望透过这个窗口,你也能发现你本不知道的重要论文。


 


撰文:Damien George 和 Rob Knegjens

编译:糖兽

参考链接:

http://paperscape.org

https://www.theguardian.com/science/2013/sep/05/paperscape-universe-scientific-research-arxiv


本文经授权转载自「原理」(ID:principia1687),禁止二次转载。



相关阅读



《寻找暗物质:打开认识宇宙的另一扇门》



(本期责编:李文超)




一起阅读科学!

科学出版社│微信ID:sciencepress-cspm

专业品质  学术价值

原创好读  科学品味

点击“阅读原文”可购买本书

登录查看更多
0

相关内容

arXiv(X依希腊文的χ发音,读音如英语的archive)是一个收集物理学、数学、计算机科学与生物学的论文预印本的网站,始于1991年8月14日。截至2008年10月,arXiv.org已收集超过50万篇预印本;至2014年底,藏量达到1百万篇。在2014年时,约以每月8000篇的速度增加。
专知会员服务
42+阅读 · 2020年7月7日
【开放书】SLAM 中的几何与学习方法,62页pdf
专知会员服务
107+阅读 · 2020年6月5日
【纽约大学】最新《离散数学》笔记,451页pdf
专知会员服务
123+阅读 · 2020年5月26日
 【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
Deep-CEE:AI深度学习工具,帮助天文学家探索深空
深度学习探索
5+阅读 · 2019年7月21日
王维嘉:暗知识——机器认知的颠覆
亚布力中国企业家论坛
5+阅读 · 2019年3月12日
R_leaflet包_最易上手地图教程(一)
R语言中文社区
10+阅读 · 2019年3月6日
【趣科研】计算机视觉极简史
中国科学院自动化研究所
9+阅读 · 2018年10月19日
150个摄影测量与遥感术语
无人机
6+阅读 · 2018年4月22日
深度学习入行门槛太低,不开心!
量子位
9+阅读 · 2017年11月20日
一张通往计算机世界的地图
中科院物理所
8+阅读 · 2017年10月12日
Learning Dynamic Routing for Semantic Segmentation
Arxiv
8+阅读 · 2020年3月23日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
q-Space Novelty Detection with Variational Autoencoders
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
VIP会员
相关VIP内容
专知会员服务
42+阅读 · 2020年7月7日
【开放书】SLAM 中的几何与学习方法,62页pdf
专知会员服务
107+阅读 · 2020年6月5日
【纽约大学】最新《离散数学》笔记,451页pdf
专知会员服务
123+阅读 · 2020年5月26日
 【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
相关资讯
Deep-CEE:AI深度学习工具,帮助天文学家探索深空
深度学习探索
5+阅读 · 2019年7月21日
王维嘉:暗知识——机器认知的颠覆
亚布力中国企业家论坛
5+阅读 · 2019年3月12日
R_leaflet包_最易上手地图教程(一)
R语言中文社区
10+阅读 · 2019年3月6日
【趣科研】计算机视觉极简史
中国科学院自动化研究所
9+阅读 · 2018年10月19日
150个摄影测量与遥感术语
无人机
6+阅读 · 2018年4月22日
深度学习入行门槛太低,不开心!
量子位
9+阅读 · 2017年11月20日
一张通往计算机世界的地图
中科院物理所
8+阅读 · 2017年10月12日
Top
微信扫码咨询专知VIP会员