刚确定研究方向是知识图谱方向,想请问该如何着手学习呢?

关注者
494
被浏览
323,385
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

目前在国内某头部科技媒体做兼职,去年对知识图谱做了较为全面的调研。不过尽可能同步一些与问题相关的信息。

知识图谱是新兴的多学科交叉的领域,涵盖语义网、自然语言处理、数据库等领域。因此,学术界知识图谱科研工作者,之前要么是做语义网的,要么是做自然语言处理的,当然还有一部分之前是做数据库的。其发展历程可以用下图表示。

当下互联网数据,可以分为结构化的数据、半结构化数据和非结构化(纯文本)数据。其中非结构化数据最多,也是最难从中抽取知识的,这是学术界研究的热点;结构化数据工业界主要在做,比如华为、蚂蚁金服、平安等。纯文本数据的知识图谱当下还没有较为成熟的落地应用方案,依然需要大量的人工去整理数据(获取知识)。

作为学习入门者,建议先熟悉知识图谱的流程(各生命周期),然后再去选择自己主要研究的方向(知识表示、实体识别、实体消歧、关系收取等)。从2018年底开始,国内陆续面市了几本知识图谱的书籍:

《知识图谱》赵军等编著,2018年12月,豆瓣评分8.1

《知识图谱:方法、实践与应用》王昊奋、漆桂林等编著,2019年8月,豆瓣评分6.9

《知识图谱:概念与技术》肖仰华编著,2020年1月,豆瓣评分7.6

注:我们在调研的过程中,书籍褒贬不一,为了不误导大家,所以给出豆瓣评分,供大家参考。最近清华大学也出版了一本书,但评价很低,所以就没有单独列出来。

除了书籍之外,国内外高校以及机构,也推出了一些知识图谱课程,调研过程中,大家提到比较多的是:

斯坦福大学的知识图谱系列课程:【CS520】斯坦福大学2020春季知识图谱课程(含中英字幕,自动生成)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili,适合英文比较好的同学,翻译是机器翻译,所以学习起来比较难受。

小象学院的知识图谱课程:知识图谱入门的知识_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili,这门课程是2018年的内容,优点是大而全,缺点是实践太少,听完后收获有限,调研过程中很多人被劝退。

深蓝学院的知识图谱课程:知识图谱理论与实践(线上) ,课程之前是4天线下集训课程,刚看官网推出了线上课程。调研期间,课程内容和服务还可以,实践比例大概占20%,但之前线下上课,知识量比较大,后期也需要仔细消化。

这些书籍以及课程教程,一定程度上降低了大家的入门门槛,但知识图谱自身知识点繁多,需要大家花费更多时间深度研究。

今年还会继续关注这个领域,有新的信息,也会及时同步。