项目名称: 面向开放领域的自动关系抽取技术研究

项目编号: No.60803078

项目类型: 青年科学基金项目

立项/批准年度: 2009

项目学科: 金属学与金属工艺

项目作者: 陈锦秀

作者单位: 厦门大学

项目金额: 20万元

中文摘要: 为了应对信息爆炸带来的挑战,迫切需要一些自动化的技术帮助人们在海量数据中迅速找到自己真正需要的信息。信息抽取技术在自然语言处理领域正越发地体现出它的重要性。本课题对信息抽取的关键支撑技术,即关系抽取任务,进行深入研究,指导计算机从自由文本中自动识别出实体之间的关系。当前国际上更多的是针对有监督学习的关系抽取技术的研究,这种技术通过训练样本的学习获得抽取模式,实现特定领域的关系抽取功能,因而需要对该知识领域较熟悉的人根据事先约定的规则来标记训练样本,同时需要足够数量的训练数据才能保证系统的抽取质量。为此,本课题积极探索面向开放领域的自动关系抽取技术,提出用多知识融合的手段来构建关系候选,建立基于图的关系抽取模型,并充分利用很容易获得的未标签样本的信息,在该图模型上进行非监督的学习,解决手工标注样本的困难,使其在各应用领域中都可扮演重要的角色,也为下一代基于自动问答的搜索引擎的发展奠定基础。

中文关键词: 信息抽取;关系抽取;多知识融合;图模型;非监督学习;

英文摘要: To challenge the information explosion, it cries for automatic techniques to help us discover useful information. Information extraction technique shows its importance more and more in the area of natural language processing. As a key subproblem of imformation extraction, relation extraction is the task of detecting and classifying relationships between two entities from text contents. To overcome the shortage of manually labeded data in supervised learning methods, our research aims to automate the process of relation extraction and investigates non-supervised learning resultions to rival supervised learning methods, so that we could resolve the problem of relation extraction with minimal human cost and towards open-domain automatic relation extraction. To realize this intention, we propose to construct domain-independent knowledge using a multi-information fusion technique, to represent each relation instance by extracting various lexical and syntactic features and present graph based models for non-supervised relation extraction task to overcome the limitations of the previous works.

英文关键词: information extraction; relation extraction; multi-information fusion; non-supervised learning; graph based model;

成为VIP会员查看完整内容
5

相关内容

知识抽取,即从不同来源、不同结构的数据中进行知识提取,形成知识(结构化数据)存入到知识图谱。
专知会员服务
79+阅读 · 2021年10月15日
专知会员服务
34+阅读 · 2021年8月19日
专知会员服务
41+阅读 · 2021年6月6日
专知会员服务
19+阅读 · 2021年4月15日
专知会员服务
43+阅读 · 2021年1月18日
专知会员服务
188+阅读 · 2020年10月14日
专知会员服务
31+阅读 · 2020年9月2日
面向司法案件的案情知识图谱自动构建
专知会员服务
120+阅读 · 2020年4月17日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
77+阅读 · 2019年10月12日
远程监督在关系抽取中的应用
深度学习自然语言处理
12+阅读 · 2020年10月26日
【关系抽取】详聊如何用BERT实现关系抽取
深度学习自然语言处理
32+阅读 · 2020年3月21日
知识图谱构建-关系抽取和属性抽取
深度学习自然语言处理
25+阅读 · 2020年3月1日
技术动态 | 跨句多元关系抽取
开放知识图谱
49+阅读 · 2019年10月24日
ACL 2019 | 面向远程监督关系抽取的模式诊断技术
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
【知识图谱】中文知识图谱构建方法研究
产业智能官
98+阅读 · 2017年10月26日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Arxiv
13+阅读 · 2019年1月26日
小贴士
相关VIP内容
专知会员服务
79+阅读 · 2021年10月15日
专知会员服务
34+阅读 · 2021年8月19日
专知会员服务
41+阅读 · 2021年6月6日
专知会员服务
19+阅读 · 2021年4月15日
专知会员服务
43+阅读 · 2021年1月18日
专知会员服务
188+阅读 · 2020年10月14日
专知会员服务
31+阅读 · 2020年9月2日
面向司法案件的案情知识图谱自动构建
专知会员服务
120+阅读 · 2020年4月17日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
77+阅读 · 2019年10月12日
相关资讯
远程监督在关系抽取中的应用
深度学习自然语言处理
12+阅读 · 2020年10月26日
【关系抽取】详聊如何用BERT实现关系抽取
深度学习自然语言处理
32+阅读 · 2020年3月21日
知识图谱构建-关系抽取和属性抽取
深度学习自然语言处理
25+阅读 · 2020年3月1日
技术动态 | 跨句多元关系抽取
开放知识图谱
49+阅读 · 2019年10月24日
ACL 2019 | 面向远程监督关系抽取的模式诊断技术
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
【知识图谱】中文知识图谱构建方法研究
产业智能官
98+阅读 · 2017年10月26日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员