即便我们不引用维基百科,我们依然在被他雕刻

2017 年 11 月 7 日 科学网 MarkZastrow

维基百科是世界上最为流行的多语言百科全书之一。尽管长久以来,科研人员不喜欢引用维基百科的内容,但最近的一项研究却发现,维基百科雕刻了学术论文语言。


编译作者:步一 /Indiana  University    

原文作者:MarkZastrow

素材推荐人:赵一鸣 / 武汉大学          

图文编辑:李江 / 浙江大学



注:图片来源于维基百科主页


维基百科(Wikipedia),是一个基于维基技术的多语言百科全书协作计划,用多种语言编写的网络百科全书;其目标及宗旨是为全人类提供自由的百科全书。『维基百科』一词取自于维基百科网站的核心技术“Wiki”以及具有百科全书之意的“encyclopedia”两词而共同创造出来的新混成词“Wikipedia”。维基百科是由非营利组织维基媒体基金会负责营运,并接受捐赠。


学术界不喜欢维基百科


长期以来,相当多的科研人员甚少在他们的著作中引用维基百科的内容;甚至有不少科研人员诟病引用维基百科的著作——缺乏学术性、引用“不靠谱”的来源等等。很多老师都建议或警告学生不要在学术论文或者课程作业里引用维基百科的内容。正如麻省理工学院Neil Thompson指出的那样:“学术界不喜欢维基百科”(Academia isfighting with Wikipedia)。


维基百科塑造了学术论文的语言


今年9月在SSRN(SocialScience Research Network)上发表的一项研究(参考文献[2])发现了维基百科对于科研人员研究和文章语言的影响。在该研究中,作者让博士生写了43篇化学专业的学术论文,这些论文的研究主题未被维基百科收录。2015年1月,该研究的作者在这些论文中随机选了一半并发表在维基百科上,另一半作为控制组则没有发表或上传。


截止2017年2月,这些发表出来的论文一共被浏览了超过200万次。随后,作者分析了化学领域最高影响力的50本Elsevier期刊的全文(截止2016年11月),以便分析这些学术论文的语言是否有一定的变化。从用词角度看,作者发现当新词汇或术语进入科研领域时,论文中的用词有所变化,大约正文中平均每250个单词中就有一个新词产生。


该研究还发现,这些文章的用词和上传到维基百科的化学论文中的用词具有一定的相似性,但与控制组中论文的相似性有显著差异。这揭示了维基百科对于科研论文语言的影响。这项研究由于使用了一定的对照试验方式,因此得到了某种可能的因果关系——维基百科在一定程度上塑造了学术论文语言。本质上,科研论文中的用词是科研人员思想和观点的反映。因此,这项研究揭示了维基百科对于科研人员潜在的更大影响。


澳大利亚的数据科学家Adam Dunn表示,这项研究的因果关系还有待进一步考证;不过,他承认,该项研究确实发现了维基百科和科研论文的语言之间存在一定的相关关系。


[1] Zastrow, M. (2017). Wikipedia shapeslanguage inscience papers. Nature, doi:10.1038/nature.2017.22656

[2] Thompson, N., & Hanley, D. (2017).Science is shaped by wikipedia: evidence from a randomized control trial. SocialScience Electronic Publishing.

[3] https://baike.baidu.com/item/维基百科/106382?fr=aladdin


登录查看更多
0

相关内容

维基百科( Wikipedia.org)是一个基于 Wiki 技术的全球性多语言百科全书协作项目,同时也是一部在网际网络上呈现的网络百科全书网站,其目标及宗旨是为全人类提供自由的百科全书。目前 Alexa 全球网站排名第六。
专知会员服务
142+阅读 · 2020年6月15日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
168+阅读 · 2020年3月10日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
ACL 2019 | 多语言BERT的语言表征探索
AI科技评论
20+阅读 · 2019年9月6日
“综述”类文章的共性问题—兼对 410 篇综述稿的分析
清华大学研究生教育
5+阅读 · 2018年7月31日
关于医学影像背后的科学,你都知道多少?
中科院物理所
3+阅读 · 2017年12月14日
蔡志忠:我不同意三个臭皮匠顶一个诸葛亮
笔记侠
3+阅读 · 2017年11月30日
Arxiv
4+阅读 · 2019年12月2日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
6+阅读 · 2018年8月27日
Arxiv
5+阅读 · 2016年1月15日
VIP会员
相关VIP内容
专知会员服务
142+阅读 · 2020年6月15日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
168+阅读 · 2020年3月10日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
Top
微信扫码咨询专知VIP会员