项目名称: 构建面向Web的、以实体为中心的知识库的关键技术研究

项目编号: No.61272088

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 王建勇

作者单位: 清华大学

项目金额: 80万元

中文摘要: 随着互联网的迅速发展及在线数据的急剧上升,用户从海量数据中搜索有价值的信息变得越来越困难,并且随着数据库、自然语言处理和数据挖掘等领域的相关技术不断应用到信息检索当中,搜索引擎从关键字搜索发展到智能搜索成为可能。而实现智能搜索的一项关键任务就是基于Web的实体知识库的构建。本项目基于丰富的网络资源,以建立实体知识库来为Web智能搜索服务作为基本应用目标,以实体及关系提取、实体名字排歧、实体知识库链接整合、以及实体知识库索引等关键技术作为研究重点,拟解决以下三类研究问题: 第一,基于大规模Web网页以及现有知识库,实现实体的准确提取,设计实体名字排歧方法,进行实体与知识库链接、整合;第二,对实体及其相关属性进行建模,提取实体关系;第三,开展实体知识库索引技术研究,以支持快速查询和动态更新。 最后将建立一个基于实体的知识库系统,以验证成果的正确性和可行性,为开发下一代智能搜索系统奠定基础。

中文关键词: 数据库;索引结构;实体;关系;

英文摘要: With the rapid development of the Internet and the sharp rise of online data, discovering valuable information from the massive data becomes increasingly difficult. Meanwhile, with the application of the technologies from the fields of database, natural language processing, and data mining to information retrieval, it becomes feasible for keyword search to evolve to intelligent search. One of the most important steps in Web intelligent search service is to build a solid Web-based knowledge base, which turns out to be the aim of this project. With the rich Internet data, we will mainly study in this project some key techniques regarding entity and relationship extraction, entity name disambiguation, entity linking with knowledge bases, as well as the storage and index system for an entity-centric knowledge base. Specifically, we intend to explore the following three research problems. First, based on the large-scale Web data and existing knowledge bases, we will design some methods for accurately extracting entities, disambiguating entity names, and linking entities with existing knowledge bases. Second, we plan to build the entity-relation model based on all the entities and entity attributes. Third, we will develop an index scheme for the entity-centric knowledge base to support fast queries and dynamic update

英文关键词: Database;Index Structure;Entity;Relation;

成为VIP会员查看完整内容
7

相关内容

数据库( Database )或数据库管理系统( Database management systems )是按照数据结构来组织、存储和管理数据的仓库。目前数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。
空间数据智能:概念、技术与挑战
专知会员服务
81+阅读 · 2022年2月3日
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
专知会员服务
122+阅读 · 2021年6月12日
专知会员服务
189+阅读 · 2020年10月14日
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
280+阅读 · 2020年10月6日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
81+阅读 · 2020年5月2日
面向司法案件的案情知识图谱自动构建
专知会员服务
120+阅读 · 2020年4月17日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
28+阅读 · 2020年4月12日
知识图谱本体结构构建论文合集
专知会员服务
102+阅读 · 2019年10月9日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
56+阅读 · 2018年4月5日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
人工智能学家
16+阅读 · 2017年11月11日
【知识图谱】中文知识图谱构建方法研究
产业智能官
98+阅读 · 2017年10月26日
最全知识图谱综述#1: 概念以及构建技术
机器学习研究会
72+阅读 · 2017年9月28日
徐波 | 百科知识图谱构建
开放知识图谱
12+阅读 · 2017年9月11日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
5+阅读 · 2008年12月31日
Arxiv
10+阅读 · 2020年6月12日
小贴士
相关VIP内容
空间数据智能:概念、技术与挑战
专知会员服务
81+阅读 · 2022年2月3日
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
专知会员服务
122+阅读 · 2021年6月12日
专知会员服务
189+阅读 · 2020年10月14日
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
280+阅读 · 2020年10月6日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
81+阅读 · 2020年5月2日
面向司法案件的案情知识图谱自动构建
专知会员服务
120+阅读 · 2020年4月17日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
28+阅读 · 2020年4月12日
知识图谱本体结构构建论文合集
专知会员服务
102+阅读 · 2019年10月9日
相关资讯
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
56+阅读 · 2018年4月5日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
人工智能学家
16+阅读 · 2017年11月11日
【知识图谱】中文知识图谱构建方法研究
产业智能官
98+阅读 · 2017年10月26日
最全知识图谱综述#1: 概念以及构建技术
机器学习研究会
72+阅读 · 2017年9月28日
徐波 | 百科知识图谱构建
开放知识图谱
12+阅读 · 2017年9月11日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
5+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员