While scholarly citations are pivotal for assessing academic impact, they often reflect systemic biases beyond research quality. This study examines a critical yet underexplored driver of citation disparities: authors' structural positions within scientific collaboration networks. Through a large-scale analysis of 17,942 papers from three top-tier machine learning conferences (NeurIPS, ICML, ICLR) published between 2005 and 2024, we quantify the influence of author centrality on citations. Methodologically, we advance the field by employing beta regression to model citation percentiles, which appropriately accounts for the bounded nature of citation data. We also propose a novel centrality metric, Harmonic Closeness with Temporal and Collaboration Count Decay (HCTCD), which incorporates temporal decay and collaboration intensity. Our results robustly demonstrate that long-term centrality exerts a significantly stronger effect on citation percentiles than short-term metrics, with closeness centrality and HCTCD emerging as the most potent predictors. Importantly, team-level centrality aggregation, particularly through exponentially weighted summation, explains citation variance more effectively than conventional rank-based approaches, underscoring the primacy of collective network connectivity over individual prominence. Integrating centrality features into machine learning models yields a 2.4% to 4.8% reduction in prediction error (MSE), confirming their value beyond content-based benchmarks. These findings challenge entrenched evaluation paradigms and advocate for network-aware assessment frameworks to mitigate structural inequities in scientific recognition.


翻译:尽管学术引用对于评估学术影响力至关重要,但它们往往反映出超越研究质量的系统性偏见。本研究探讨了一个关键但尚未被充分探索的引用差异驱动因素:作者在科学合作网络中的结构位置。通过对2005年至2024年间在三个顶级机器学习会议(NeurIPS、ICML、ICLR)上发表的17,942篇论文进行大规模分析,我们量化了作者中心性对引用的影响。在方法论上,我们通过采用Beta回归来建模引用百分位数,推动了该领域的发展,这恰当地考虑了引用数据的有界性。我们还提出了一种新颖的中心性度量指标:具有时间与合作次数衰减的调和接近中心性(HCTCD),该指标融合了时间衰减和合作强度。我们的结果有力地证明,长期中心性对引用百分位数的影响显著强于短期度量指标,其中接近中心性和HCTCD成为最有效的预测因子。重要的是,团队层面的中心性聚合(特别是通过指数加权求和)比传统的基于排名的方法更能有效地解释引用方差,这突显了集体网络连通性相对于个体突出性的首要地位。将中心性特征整合到机器学习模型中,可将预测误差(MSE)降低2.4%至4.8%,证实了它们在超越基于内容的基准之外的价值。这些发现挑战了根深蒂固的评估范式,并倡导采用具备网络意识的评估框架,以缓解科学认可中的结构性不平等。

0
下载
关闭预览

相关内容

论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks
开放知识图谱
14+阅读 · 2020年4月8日
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员