SciHub下载量成论文影响力预测指标:能被下载的论文被引次数高出72%

2020 年 7 月 2 日 量子位
鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

嗑盐的你,用过Sci-hub吗?

作为一个能免费看论文的学术搜索引擎,Sci-hub是科研人员的秘宝,同时,却也是学术出版商眼中的大毒瘤。

现在,有人站出来,用统计数据为Sci-hub正名:

能通过Sci-hub下载的文章的被引次数,是Sci-hub上下不到的文章的1.72倍

也就是说,Sci-hub的下载量,已经成为论文影响力的重要指标。

这个结果一公布,立刻引发了网友的共鸣:

我总要先能看文章,然后才能引用啊。

Sci-hub,让文章更具影响力

这项针对Sci-hub影响力的研究,被研究人员们公开放在了arXiv上。

研究人员认为,Sci-hub作为一个闻名全球的项目,对于学术体系中的所有人都影响深远。

因为它能绕过大多数学术出版商的付费墙,实际上增强了论文的潜在影响力。

他们希望通过数据证明,Sci-hub的下载量与论文未来的引用量是正相关的。

数据集

研究人员为此准备了两个数据集,其中包含Nature、Science在内的12种顶级期刊上发表的文章信息,横跨神经科学、经济学等多个领域。

第一个数据集包含2015年9月至2016年2月这段时间内,能从Sci-hub上下载到的所有文章。

第二个数据集则来自传统的Scopus数据库,包含同一时段内,在选定期刊上发表的所有文章。

并且,通过跟第一个数据集的对照,研究人员筛掉了其中能在Sci-hub上下载的文章,使其仅包括无法通过Sci-hub免费获取的论文。

对于每一篇论文,研究人员都统计了其中图表的数量。另外,还统计了每篇论文第一作者和通讯作者的H-index、每本期刊的影响因子,以及每个作者所属国家的研究资源等数据。

研究结果

根据引文统计分布,文章引用次数超过2000次的论文被视作离群值。

研究人员通过最小二乘法、离群值影响、带有工具变量的稳健回归、异方差校正等等一系列广义加成模型来评估关系的敏感性。

在控制了所有的偏差来源之后,结果显示,能从Sci-hub下载的论文的被引次数,是不能从Sci-hub下载的论文的1.72倍(p<0.001)。

并且,Sci-hub下载量越高,论文的被引次数也越高。

在所有选定的期刊和涉及的学科中,Sci-hub的影响都很明显。

另外,结果也表明,图表丰富的论文更容易被引用。

研究人员认为,这样的Sci-hub效应具有多重意义。

第一,除了作为一个面对全球开放存取的「线上图书馆」,Sci-hub的下载量也可以作为一个重要的参考数据,用以预测论文未来的引用量。

第二,Sci-hub效应的存在,表明论文的版权限制,很可能会阻碍科研人员的工作。

在过去的几十年里,不仅通过像Sci-hub这样的途径「盗版」的科学论文越来越多,arXiv这样的开放预印本论文平台也越来越受到科研人员的认可。

不过,矛盾的是,Sci-hub的存在也可能反过来维护了当前的出版系统——当人们有途径能获取免费论文时,对封闭出版系统带来的限制感知就没有那么强烈了。

影响全球学术界的Sci-hub

Sci-hub创建于2011年。创始人是一位来自哈萨克斯坦的研究生Alexandra Elbakyan。

科研女神,在线挥手

她的初衷很简单——天下苦学术出版商久矣。

毕竟,学术出版商是这样定价的:

对于一家上市公司来说,赚取多少利润合适,答案是“看市场能承受多少”。

以Elsevier为例,其订阅费每年都在上涨,到了2018年,加州大学(UC)系统平均每年要向Elsevier支付约1100万美元(约合7377万元人民币)的订阅费用。这还没完,在协商签订新协议的时候,这家出版商还要求继续提价。

而早在2012年,Elsevier公布的利润率就已经超过了40%。赚钱能力甚至超过了苹果、微软等科技巨头。

这样的巨额收费,一直被认为是在阻碍科学开放、知识民主。

而Sci-Hub不仅包含Elsevier,还提供Springer、IEEE旗下期刊、ACS等出版商的文章,覆盖范围非常广。

所以,不仅是中国、印度这样的发展中国家给Sci-hub提供了大量下载量,Science网站2016年发布的一份报告显示,在2015年9月到2016年2月期间,美国本土就有115万次Sci-hub下载请求,仅次于俄罗斯位居第五。

这无疑动了学术出版商的蛋糕。单纯站在法律角度,也确属违法。

2015年11月,在Elsevier的控告下,Sci-hub域名遭到封锁。从此Sci-Hub开始了流浪之旅,迁移到美国无法管辖的地方,网址频频更换。

创始人Elbakyan也为了避免被引渡到美国,开始四处躲藏。Science网站评价她是“可敬的利他主义抑或大型犯罪者,而这取决于你的立场。”

但无论如何,学术出版商利用长久以来积累的名望,使科研人员们不得不为职业生涯考虑,接受其昂贵的订阅收费服务,甚至被限制在论文发表后公开免费放出论文,这样的现状,负面影响正在慢慢显现。

正如这项研究中谈到的,对论文的访问限制,可能会导致科学研究无法充分发挥其影响力。

你觉得呢?

传送门

论文地址:
https://arxiv.org/abs/2006.14979


本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

特惠福利 | 一站式音视频解决方案

想赶上直播电商、在线教育、小程序直播的风口?腾讯云音视频解决方案为您助力!
腾讯云推出9.9元产品体验包,包括云点播、云直播、实时音视频,总有一款适合你。识别二维码即可体验:


量子位 QbitAI · 头条号签约作者


վ'ᴗ' ի 追踪AI技术和产品新动态


喜欢就点「在看」吧 !


登录查看更多
0

相关内容

专知会员服务
143+阅读 · 2020年6月15日
ACL2020接受论文列表公布,571篇长文208篇短文
专知会员服务
66+阅读 · 2020年5月19日
缺失数据统计分析,第三版,462页pdf
专知会员服务
103+阅读 · 2020年2月28日
【综述】关键词生成,附10页pdf论文下载
专知会员服务
52+阅读 · 2019年11月20日
中国工程院:《全球工程前沿2018》(附PDF下载)
走向智能论坛
10+阅读 · 2018年12月5日
收藏 | 最新知识图谱论文清单(附解读、下载)
THU数据派
10+阅读 · 2018年11月19日
阅读深度学习论文的新姿势
专知
15+阅读 · 2018年7月14日
学术汪必备的科研工具大集合!
清华大学研究生教育
9+阅读 · 2018年6月6日
下载 ‖ 十大医疗数据集
机械鸡
102+阅读 · 2017年8月5日
Arxiv
14+阅读 · 2020年2月6日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
5+阅读 · 2018年10月11日
Arxiv
4+阅读 · 2017年4月12日
VIP会员
相关资讯
中国工程院:《全球工程前沿2018》(附PDF下载)
走向智能论坛
10+阅读 · 2018年12月5日
收藏 | 最新知识图谱论文清单(附解读、下载)
THU数据派
10+阅读 · 2018年11月19日
阅读深度学习论文的新姿势
专知
15+阅读 · 2018年7月14日
学术汪必备的科研工具大集合!
清华大学研究生教育
9+阅读 · 2018年6月6日
下载 ‖ 十大医疗数据集
机械鸡
102+阅读 · 2017年8月5日
Top
微信扫码咨询专知VIP会员