前沿领域-“知识图谱”介绍
更多欢迎来到个人博客阅读!网址如下:
知识图谱是大数据时代知识表示的主要形态之一,是人工智能应用不可或缺的基础资源,自2012年提出至今,受到学术界和产业界越来越多的关注。人工智能知识分享 - 一个全方位的人工智能知识宝库知识图谱是大数据时代知识表示的主要形态之一,是人工智能应用不可或缺的基础资源,自2012年提出至今,受到学术界和产业界越来越多的关注。
做知识图谱需要应用到自然语言处理技术,自然语言处理(NLP)在近两年可以说是沸沸扬扬,从BERT、GPT2到今年再一颠覆性突破的XLNet模型(去年 10 月,「最强 NLP 预训练模型」Bert 问世,横扫 11 项 NLP 任务记录。但仅仅过了 8 个月,这一「最强」模型就遭到 XLNet 的碾压,后者在 20 项任务上超越前者,又一次刷新 NLP 预训练模型的各项记录。),虽然进步巨大,但是仍非智能,并且训练代价非常高,据统计:
- BERT:1.2 万美元
- GPT-2:4.3 万美元
- XLNet:6.1 万美元
BERT原论文中描述,大型 BERT 模型在 16 个 Cloud TPU 上需要训练 4 天。
伴随着人工智能浪潮,知识图谱迅速发展,已经在语义搜索、问答系统、智能客服、个性化推荐等通用领域得到较为广泛的应用。国内长期从事知识图谱领域研究的团队很少,所以工资普遍很高。
下面对知识图谱进行介绍:
知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。
知识图谱技术是指知识图谱建立和应用的技术,是融合认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义 Web、数据挖掘与机器学习等交叉研究,属人工智能重 要研究领域知识工程的研究范畴。知识图谱于 2012 年由谷歌提出并成功应用于搜索引擎, 是建立大规模知识的一个杀手锏应用。
知识图谱主要有知识表示与建模、知识获取、知识融合、知识图谱查询推理及知识图谱应用五个子领域。
知识表示与建模
知识表示学习将实体和关系表示为稠密的低维向量实现了对实体和关系的分布式表示,已经成为知识图谱语义链接预测和知识补全的重要方法。
知识获取
主要有:实体识别与链接、实体关系学习、事件知识学习。
知识获取主要是面向开放的链接数据,通常典型的输入是自然语言文本或者多媒体内容文档(图像或者视频)等。然后通过自动化或者半自动化的技术抽取出可用的知识单元,知识单元主要包括实体(概念的外延)、关系以及属性3个知识要素,并以此为基础,形成一系列高质量的事实表达,为上层模式层的构建奠定基础。
知识融合
够将不同的知识图谱融合为一个统一、一致、简洁的形式,为使用不同知识图谱的应用程序间的交互建立操作性。
知识图谱查询推理
知识推理从给定的知识图谱推导出新的实体跟实体之间的关系。
知识图谱以图(Graph)的方式来展现实体、事件及其之间的关系。知识图谱存储和查询研究如何设计有效的存储模式支持对大规模图数据的有效管理,实现对知识图谱中知识高效查询。
主要有两种存储查询方式:
(1)基于关系数据模型的 RDF 数据存储和查询
(2)基于图模型的 RDF 数据存储和查询
知识图谱的典型应用包括语义搜索、智能问答以及可视化决策支持三种。
(1) 语义搜索
谷歌搜索就是典型的应用示例。
(2) 智能问答
典型的客服应用,比较高级的有法律顾问、医学顾问等应用,可以通过描述情况,算法根据描述的内容来对内容进行评价。
(3) 可视化决策支持
典型应用:
人物关系网
总结:
如果未来的智能机器拥有一个大脑,知识图谱就是这个大脑中的知识库,对于大数据智能具有重要意义,将对自然语言处理、信息检索和人工智能等领域产生深远影响。