资源 | 基于神经网络的命名实体识别 NeuroNER

2017 年 6 月 14 日 机器之心

选自Neuroner

机器之心编译

参与:李亚洲


本文主要介绍了一种基于神经网络的命名实体识别系统 NeuroNER,并附上了安装、下载的项目地址,希望对自然语言处理感兴趣的同学有所帮助。


NeuroNER 下载项目地址:https://github.com/Franck-Dernoncourt/NeuroNER


什么是命名实体识别(NER)?


NER 旨在识别文本中的有趣实体,例如位置、组织和时序表达。识别实体可被用于各种下游应用,比如病历去识别化(de-identification)和信息提取系统,也可作为其他自然语言处理任务机器学习系统的特征。


NeuroNER 能做什么?


NeuroNER 是一个能完成 NER 任务的项目:



NeuroNER 相比于已由的 NER 系统,能提供以下优势:


  • 利用神经网络的顶尖预测能力(也就是深度学习)

  • 让用户能够创造新的语料库或修改已有语料库

  • 它是跨平台的、开源的、免费直接使用的


如何使用 NeuroNER?


下图对 NeuroNER 的功能做出了简要介绍,具体描述如下:


  • 训练神经网络完成 NER 任务。在训练的过程中,NeuroNER 允许监控网络。

  • 评估 NeuroNER 所做预测的质量。表现标准可通过预测标签与金色标签的对比来计算、标绘。如果测试集与训练和验证集同时提供,评估也可在训练的同时完成,或者在训练后分开完成,或者使用预训练模型。

  • 部署 NeuroNER 作为产品使用:NeuroNER 标记了部署集,也就是没有金色标签的新文本。



NeuroNER 引擎如何工作?


NeuroNER 引擎基于人工神经网络,特别是依赖一种循环神经网络的变体 LSTM。NER 引擎的人工神经网络包含三层:


  • 字符增强的 token 嵌入(Character-enhanced token-embedding)层

  • 标签预测层

  • 标签序列优化层


下图展现了 NeuroNER 引擎中用到的人工神经网络的架构:



如何安装 NeuroNER


GitHub 上的 repository 解释了安装指南,以下视频展示了使用安装脚本在 Ubuntu 上进行安装有多么简单:脚本会安装你所需的所有东西,然后在 CoNLL-2003 数据集上进行训练。在数个训练 epoch 之后,模型获得了顶尖的成果。 




原文链接:http://neuroner.com/



本文为机器之心编译,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者/实习生):hr@jiqizhixin.com

投稿或寻求报道:editor@jiqizhixin.com

广告&商务合作:bd@jiqizhixin.com


点击阅读原文,查看机器之心官网↓↓↓

登录查看更多
3

相关内容

命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
153+阅读 · 2020年4月21日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
68+阅读 · 2020年1月17日
谷歌机器学习速成课程中文版pdf
专知会员服务
142+阅读 · 2019年12月4日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
196+阅读 · 2019年9月30日
【Strata Data Conference】用于自然语言处理的深度学习方法
专知会员服务
48+阅读 · 2019年9月23日
论文浅尝 | 基于知识库的神经网络问题生成方法
开放知识图谱
19+阅读 · 2019年6月21日
基于PyTorch/TorchText的自然语言处理库
专知
27+阅读 · 2019年4月22日
R语言自然语言处理:词性标注与命名实体识别
R语言中文社区
7+阅读 · 2019年3月5日
NLP - 基于 BERT 的中文命名实体识别(NER)
AINLP
466+阅读 · 2019年2月10日
命名实体识别(NER)综述
AI研习社
65+阅读 · 2019年1月30日
实践 | 如何快速训练免费的文本生成神经网络
黑龙江大学自然语言处理实验室
4+阅读 · 2018年6月4日
Arxiv
14+阅读 · 2018年5月15日
Arxiv
3+阅读 · 2018年4月3日
Arxiv
6+阅读 · 2018年2月24日
VIP会员
相关VIP内容
相关资讯
论文浅尝 | 基于知识库的神经网络问题生成方法
开放知识图谱
19+阅读 · 2019年6月21日
基于PyTorch/TorchText的自然语言处理库
专知
27+阅读 · 2019年4月22日
R语言自然语言处理:词性标注与命名实体识别
R语言中文社区
7+阅读 · 2019年3月5日
NLP - 基于 BERT 的中文命名实体识别(NER)
AINLP
466+阅读 · 2019年2月10日
命名实体识别(NER)综述
AI研习社
65+阅读 · 2019年1月30日
实践 | 如何快速训练免费的文本生成神经网络
黑龙江大学自然语言处理实验室
4+阅读 · 2018年6月4日
Top
微信扫码咨询专知VIP会员