Automatic recognition of affiliations in the metadata of scholarly publications is a key point for monitoring and analyzing trends in scientific production, especially in an open science context. We propose an automatic alignment method on registries, based on Elasticsearch. The proposed method is modular and leaves the choice of the alignment criteria to the user, allowing him to keep control over the precision and recall of the method. An implementation is proposed for an automatic alignment on three registries: countries, GRID.ac and RNSR (research laboratory directory in France) on the Github https://github.com/dataesr/matcher and the performances are analyzed in this paper.


翻译:自动确认学术出版物元数据中的关联性是监测和分析科学生产趋势的关键,特别是在开放的科学背景下。我们提议基于Elasticsearch的登记册自动调整方法。提议的方法是模块化的,由用户选择调整标准,使他能够控制方法的准确性和召回。建议实施三个登记册的自动调整:国家、全球资源信息数据库、法国研究实验室目录。本文分析了Github https://github.com/dataesr/matcher的绩效。

0
下载
关闭预览

相关内容

专知会员服务
38+阅读 · 2020年9月6日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
已删除
将门创投
13+阅读 · 2019年4月17日
Arxiv
5+阅读 · 2021年6月3日
Multi-Grained Named Entity Recognition
Arxiv
6+阅读 · 2019年6月20日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
72+阅读 · 2018年12月22日
Arxiv
15+阅读 · 2018年2月4日
VIP会员
相关VIP内容
专知会员服务
38+阅读 · 2020年9月6日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
已删除
将门创投
13+阅读 · 2019年4月17日
Top
微信扫码咨询专知VIP会员