知识图谱 - 专知主题

关注 1938

知识图谱（Knowledge Graph），在图书情报界称为知识域可视化或知识领域映射地图，是显示知识发展进程与结构关系的一系列各种不同的图形，用可视化技术描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合，并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

知识荟萃

知识图谱（Knowledge Graph）专知荟萃

综述

知识图谱简史：从1950到2019
- [http://knowledgegraph.today/paper.html]
知识表示学习研究进展刘知远 2016
- [http://nlp.csai.tsinghua.edu.cn/~lyk/publications/knowledge_2016.pdf]
知识图谱研究进展漆桂林 2017
- [[http://tie.istic.ac.cn/ch/reader/view_abstract.aspx?doi=10.3772/j.issn.2095-915x.2017.01.002]]
知识图谱技术综述徐增林
- [http://www.xml-data.org/dzkj-nature/html/201645589.htm]
基于表示学习的知识库问答研究进展与展望刘康
- [http://www.aas.net.cn/CN/10.16383/j.aas.2016.c150674]
Knowledge Graph Refinement: A Survey of Approaches and Evaluation Methods Heiko Paulheim
- [http://www.semantic-web-journal.net/system/files/swj1167.pdf]
【专知综述】 [干货] 最全知识图谱综述
- [https://www.zhuanzhi.ai/knowledge/c06da1d6a5930b80293955ca3f6bbf53]
- [https://www.zhuanzhi.ai/knowledge/307374e5b93fce99931d3d73b179b37c]
万字长文| 中文知识图谱构建技术以及应用的综述
- [https://www.mdpi.com/2071-1050/10/9/3245]
Quan Wang, Zhendong Mao, Bin Wang, Li Guo: Knowledge Graph Embedding: A Survey of Approaches and Applications. IEEE Trans. Knowl. Data Eng. 29(12): 2724-2743 (2017)
Seyed Mehran Kazemi, Rishab Goel, Kshitij Jain, Ivan Kobyzev, Akshay Sethi, Peter Forsyth, Pascal Poupart: Relational Representation Learning for Dynamic (Knowledge) Graphs: A Survey. CoRR abs/1905.11485 (2019)
杭婷婷等，知识图谱构建技术:分类、调查和未来方向（计算机科学）：[https://www.jsjkx.com/CN/article/openArticlePDF.jsp?id=19736]（2020.10）
Xiaojun，ChenShengbin，JiaYangXiang: A review: Knowledge reasoning over knowledge graph. Expert Systems with Applications 141(2020.3)
Xiaohan Zou: A Survey on Application of Knowledge Graph. J. Phys.: Conf. Ser. 1487(2020)
Qingyu Guo; Fuzhen Zhuang; Chuan Qin; Hengshu Zhu; Xing Xie; Hui Xiong;Qing He: A Survey on Knowledge Graph-Based Recommender Systems. IEEE Transactions on Knowledge and Data Engineering(2020)
Zhe Chen; Yuehan Wang; Bin Zhao; Jing Cheng; Xin Zhao; Zongtao Duan: Knowledge Graph Completion: A Review. IEEE Access 8: 192435 - 192456(2020)
知识图谱可解释推理研究综述（软件学报）侯中妮靳小龙等：[http://www.jos.org.cn/jos/article/abstract/6522]（2021）
Rossi A, Barbosa D, Firmani D, et al. Knowledge graph embedding for link prediction: A comparative analysis. ACM Transactions on Knowledge Discovery from Data (TKDD), 2021, 15(2): 1-49.
Xiangru Zhu, Zhixu Li, Xiaodan Wang, Xueyao Jiang, Penglei Sun, Xuwu Wang, Yanghua Xiao, Nicholas Jing Yuan,Multi-Modal Knowledge Graph Construction and Application: A Survey,2022

白皮书

《知识图谱标准化白皮书》（2019版）发布，200页pdf，中国电子技术标准化研究院主编
- [https://www.zhuanzhi.ai/vip/041c268d53bcd3290a5f6229218aaa36]
中国中文信息学会,《2018知识图谱发展报告》,163页pdf
- [https://cips-upload.bj.bcebos.com/KGDevReport2018.pdf]
中国电子技术标准化研究院，《知识图谱选型与实施指南》（2021年版）
- [https://www.jianguoyun.com/p/DQnRU9kQyrjVCRjVkqIE]
认知智能国家重点实验室&艾瑞咨询联合发布，《面向人工智能“新基建”的知识图谱行业白皮书》（2020年）
- [http://pg.jrj.com.cn/acc/Res/CN_RES/INDUS/2020/11/27/4c4e70cd-d73f-4069-a004-388086b597d2.pdf]

重要报告

阿里巴巴集团蚂蚁集团，《图可视化解决⽅案：知识图谱》（2020.11）
- [https://gw.alipayobjects.com/os/bmw-prod/e59ca575-b23b-4a60-a88e-ae1fab938593.pdf]
Jingbo Shang, Jiaming Shen, Liyuan Liu, Jiawei Han，Computer Science Department, University of Illinois at Urbana-Champaign,SIGKDD 2019 Tutorial
- [https://shangjingbo1226.github.io/2019-04-22-kdd-tutorial/]
Fariz Darari博士，KNOWLEDGE GRAPHS MINI HANDBOOK“知识图谱简明手册”（2020.11）
- [https://drive.google.com/file/d/1fuRw7I0kcV-ErYXd9pVcVe2ukbUHLgcv/view]

模型算法

知识图谱构建

语义单元挖掘

Rada Mihalcea, Paul Tarau: TextRank: Bringing Order into Text. EMNLP 2004: 404-411 [https://web.eecs.umich.edu/~mihalcea/papers/mihalcea.emnlp04.pdf]
Paul Deane: A Nonparametric Method for Extraction of Candidate Phrasal Terms. ACL 2005: 605-613 [https://www.aclweb.org/anthology/P05-1075/]
Jialu Liu, Jingbo Shang, Chi Wang, Xiang Ren, Jiawei Han: Mining Quality Phrases from Massive Text Corpora. SIGMOD Conference 2015: 1729-1744 [https://dl.acm.org/citation.cfm?doid=2723372.2751523]
Ahmed El-Kishky, Yanglei Song, Chi Wang, Clare R. Voss, and Jiawei Han, "Scalable Topical Phrase Mining from Text Corpora", 2015 Int. Conf. on Very Large Data Bases (VLDB'15) [http://elkishk2.web.engr.illinois.edu/]
On the unsupervised analysis of domain-specific Chinese texts.Deng K, Bol PK, Li KJ, Liu JS.PNAS 2016. [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4896694/pdf/pnas.201516510.pdf]
Jingbo Shang, Jialu Liu, Meng Jiang, Xiang Ren, Clare R. Voss, Jiawei Han: Automated Phrase Mining from Massive Text Corpora. IEEE Trans. Knowl. Data Eng. 30(10): 1825-1837 (2018) [https://ieeexplore.ieee.org/document/8306825]
Kazuya Kawakami, Chris Dyer, Phil Blunsom: Unsupervised Word Discovery with Segmental Neural Language Models. CoRR abs/1811.09353 (2018)

信息抽取：实体、属性与关系、事件

Jing Li, Aixin Sun, Jianglei Han, Chenliang Li: A Survey on Deep Learning for Named Entity Recognition. CoRR abs/1812.09449 (2018) [https://arxiv.org/abs/1812.09449]
Shantanu Kumar: A Survey of Deep Learning Methods for Relation Extraction. CoRR abs/1705.03645 (2017) [https://arxiv.org/abs/1705.03645]
Relation Extraction : A Survey. Sachin Pawara,b, Girish K. Palshikara, Pushpak Bhattacharyyab. 2017 [https://arxiv.org/abs/1712.05191]
Alisa Smirnova, Philippe Cudré-Mauroux: Relation Extraction Using Distant Supervision: A Survey. ACM Comput. Surv. 51(5): 106:1-106:35 (2019) [https://dl.acm.org/citation.cfm?doid=3271482.3241741]

本体构建

Chengyu Wang, Xiaofeng He, Aoying Zhou: A Short Survey on Taxonomy Learning from Text Corpora: Issues, Resources and Recent Advances. EMNLP 2017: 1190-1203 [https://www.aclweb.org/anthology/D17-1123/]
Quan Fang, Changsheng Xu, Jitao Sang, M. Shamim Hossain, Ahmed Ghoneim: Folksonomy-Based Visual Ontology Construction and Its Applications. IEEE Trans. Multimedia 18(4): 702-713 (2016)
Huaiwen Zhang, Quan Fang, Shengsheng Qian, Changsheng Xu: Learning Multimodal Taxonomy via Variational Deep Graph Embedding and Clustering. ACM Multimedia 2018: 681-68
Chengyu Wang, Xiaofeng He, Aoying Zhou: Improving Hypernymy Prediction via Taxonomy Enhanced Adversarial Learning. AAAI 2019: 7128-7135
Yu Shi, Jiaming Shen, Yuchen Li, Naijing Zhang, Xinwei He, Zhengzhi Lou, Qi Zhu, Matthew Walker, Myunghwan Kim, Jiawei Han: Discovering Hypernymy in Text-Rich Heterogeneous Information Network by Exploiting Context Granularity. CIKM 2019: 599-608

知识图谱表示嵌入

A Three-Way Model for Collective Learning on Multi-Relational Data, Maximilian Nickel, Volker Tresp, Hans-Peter Kriegel, ICML 2011
Translating Embeddings for Modeling Multi-relational Data, Antoine Bordes, Nicolas Usunier, Alberto Garcia-Duran, Jason Weston, Oksana Yakhnenko, NIPS 2013
Knowledge Graph Embedding by Translating on Hyperplanes Zhen Wang, Jianwen Zhang, Jianlin Feng, Zheng Chen, AAAI 2014
[Reducing the Rank of Relational Factorization Models by Including Observable Patterns] (http://papers.nips.cc/paper/5448-reducing-the-rank-in-relational-factorization-models-by-including-observable-patterns.pdf), Maximilian Nickel, Xueyan Jiang, Volker Tresp, NIPS 2014
Learning Entity and Relation Embeddings for Knowledge Graph Completion, Yankai Lin, Zhiyuan Liu, Maosong Sun, Yang Liu, Xuan Zhu, AAAI 2015
A Review of Relational Machine Learning for Knowledge Graph, Maximilian Nickel, Kevin Murphy, Volker Tresp, Evgeniy Gabrilovich, IEEE 2015
Knowledge Graph Embedding via Dynamic Mapping Matrix, Guoliang Ji, Shizhu He, Liheng Xu, Kang Liu, Jun Zha, ACL 2015.
Modeling Relation Paths for Representation Learning of Knowledge Bases, Yankai Lin, Zhiyuan Liu, Huanbo Luan, Maosong Sun, Siwei Rao, Song Liu, EMNLP 2015
Embedding Entities and Relations for Learning and Inference in Knowledge Bases, Bishan Yang, Wen-tau Yih, Xiaodong He, Jianfeng Gao, Li Deng, ICLR 2015
Holographic Embeddings of Knowledge Graphs, Maximilian Nickel, Lorenzo Rosasco, Tomaso Poggio, AAAI 2016
Complex Embeddings for Simple Link Prediction, Théo Trouillon, Johannes Welbl, Sebastian Riedel, Éric Gaussier, Guillaume Bouchard, ICML 2016
Modeling Relational Data with Graph Convolutional Networks, Michael Schlichtkrull, Thomas N. Kipf, Peter Bloem, Rianne Van Den Berg, Ivan Titov, Max Welling, arXiv 2017
Fast Linear Model for Knowledge Graph Embeddings, Armand Joulin, Edouard Grave, Piotr Bojanowski, Maximilian Nickel, Tomas Mikolov, arXiv 2017
Convolutional 2D Knowledge Graph Embeddings, Tim Dettmers, Pasquale Minervini, Pontus Stenetorp, Sebastian Riedel, AAAI 2018
Knowledge Graph Embedding With Iterative Guidance From Soft Rules, Shu Guo, Quan Wang, Lihong Wang, Bin Wang, Li Guo, AAAI 2018
KBGAN: Adversarial Learning for Knowledge Graph Embeddings, Liwei Cai, William Yang Wang, NAACL 2018
Improving Knowledge Graph Embedding Using Simple Constraints, Boyang Ding, Quan Wang, Bin Wang, Li Guo, ACL 2018
SimplE Embedding for Link Prediction in Knowledge Graphs, Seyed Mehran Kazemi, David Poole, NeurIPS 2018
A Novel Embedding Model for Knowledge Base Completion Based on Convolutional Neural Network, Dai Quoc Nguyen, Tu Dinh Nguyen, Dat Quoc Nguyen, Dinh Phung, NAACL 2018
Rakshit Trivedi, Bunyamin Sisman, Xin Luna Dong, Christos Faloutsos, Jun Ma, Hongyuan Zha: LinkNBed: Multi-Graph Representation Learning with Entity Linkage. ACL (1) 2018: 252-262
Yukun Zuo, Quan Fang, Shengsheng Qian, Xiaorui Zhang, Changsheng Xu: Representation Learning of Knowledge Graphs with Entity Attributes and Multimedia Descriptions. BigMM 2018: 1-5
Iteratively Learning Embeddings and Rules for Knowledge Graph Reasoning, Wen Zhang, Bibek Paudel, Liang Wang, Jiaoyan Chen, Hai Zhu, Wei Zhang, Abraham Bernstein, Huajun Chen, WWW 2019
RotatE: Knowledge Graph Embedding by Relational Rotation in Complex Space, Zhiqing Sun, Zhi-Hong Deng, Jian-Yun Nie, Jian Tang, ICLR 2019
Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs, Deepak Nathani, Jatin Chauhan, Charu Sharma, Manohar Kaul, ACL 2019
Probabilistic Logic Neural Networks for Reasoning, Meng Qu, Jian Tang, NeurIPS 2019
Quaternion Knowledge Graph Embeddings, Shuai Zhang, Yi Tay, Lina Yao, Qi Liu, NeurIPS 2019
Multi-relational Poincaré Graph Embeddings, Ivana Balaževic, Carl Allen, Timothy Hospedales, NeurIPS 2019

知识图谱融合

Xin Dong, Evgeniy Gabrilovich, Geremy Heitz, Wilko Horn, Ni Lao, Kevin Murphy, Thomas Strohmann, Shaohua Sun, Wei Zhang: Knowledge vault: a web-scale approach to probabilistic knowledge fusion. KDD 2014: 601-610
Xin Luna Dong, Evgeniy Gabrilovich, Geremy Heitz, Wilko Horn, Kevin Murphy, Shaohua Sun, Wei Zhang: From Data Fusion to Knowledge Fusion. PVLDB 7(10): 881-892 (2014)
Chao Zhang, Zichao Yang, Xiaodong He, Li Deng: Multimodal Intelligence: Representation Learning, Information Fusion, and Applications. CoRR abs/1911.03977 (2019)

知识图谱校验

Namyong Park, Andrey Kan, Xin Luna Dong, Tong Zhao, Christos Faloutsos: Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks. KDD 2019: 596-606
Shengbin Jia, Yang Xiang, Xiaojun Chen, Kun Wang, Shijia E:Triple Trustworthiness Measurement for Knowledge Graph. WWW 2019: 2865-2871

知识图谱生长

Dongwoo Kim, Lexing Xie, Cheng Soon Ong: Probabilistic Knowledge Graph Construction: Compositional and Incremental Approaches. CIKM 2016: 2257-2262

多模态知识图谱

Quan Fang, Changsheng Xu, Jitao Sang, M. Shamim Hossain, Ahmed Ghoneim: Folksonomy-Based Visual Ontology Construction and Its Applications. IEEE Trans. Multimedia 18(4): 702-713 (2016)
Huaiwen Zhang, Quan Fang, Shengsheng Qian, Changsheng Xu: Learning Multimodal Taxonomy via Variational Deep Graph Embedding and Clustering. ACM Multimedia 2018: 681-68

应用

智能搜索

Yu Su, Shengqi Yang, Huan Sun, Mudhakar Srivatsa, Sue Kase, Michelle Vanni, Xifeng Yan:Exploiting Relevance Feedback in Knowledge Graph Search. KDD 2015: 1135-1144
Chenyan Xiong, Russell Power, Jamie Callan: Explicit Semantic Ranking for Academic Search via Knowledge Graph Embedding. WWW 2017: 1271-1279

深度问答

Xiao Huang, Jingyuan Zhang, Dingcheng Li, Ping Li: Knowledge Graph Embedding Based Question Answering. WSDM 2019: 105-113

人机对话

Feng-Lin Li, Minghui Qiu, Haiqing Chen, Xiongwei Wang, Xing Gao, Jun Huang, Juwei Ren, Zhongzhou Zhao, Weipeng Zhao, Lei Wang, Guwei Jin, Wei Chu: AliMe Assist : An Intelligent Assistant for Creating an Innovative E-commerce Experience. CIKM 2017: 2495-2498

社区发现

Shreyansh P. Bhatt, Swati Padhee, Amit P. Sheth, Keke Chen, Valerie L. Shalin, Derek Doran, Brandon S. Minnery:Knowledge Graph Enhanced Community Detection and Characterization. WSDM 2019: 51-59

入门学习

大规模知识图谱技术王昊奋华东理工大学
[http://history.ccf.org.cn/sites/ccf/xhdtnry.jsp?contentId=2794147245202]
[https://pan.baidu.com/s/1i5w2RcD]
知识图谱技术原理介绍王昊奋
[http://www.36dsj.com/archives/39306]
大规模知识图谱的表示学习及其应用刘知远
[http://www.cipsc.org.cn/kg3/]
知识图谱的知识表现方法回顾与展望鲍捷
[http://www.cipsc.org.cn/kg3/]
基于翻译模型(Trans系列)的知识表示学习 paperweekly
[http://www.sohu.com/a/116866488_465975]
中文知识图谱构建方法研究1，2，3
[http://blog.csdn.net/zhangqiang1104/article/details/50212227]
[http://blog.csdn.net/zhangqiang1104/article/details/50212261]
[http://blog.csdn.net/zhangqiang1104/article/details/50212341]
TransE算法（Translating Embedding）
[http://blog.csdn.net/u011274209/article/details/50991385]
OpenKE 刘知远清华大学知识表示学习（Knowledge Embedding）旨在将知识图谱中实体与关系嵌入到低维向量空间中，有效提升知识计算效率。
[ http://openke.thunlp.org/]
面向大规模知识图谱的表示学习技术刘知远
[http://www.cbdio.com/BigData/2016-03/03/content_4675344.htm]
当知识图谱“遇见”深度学习肖仰华
[http://caai.cn/index.php?s=/Home/Article/qikandetail/year/2017/month/04.html]
NLP与知识图谱的对接白硕
[http://caai.cn/index.php?s=/Home/Article/qikandetail/year/2017/month/04.html]

12.【干货】最全知识图谱综述#1: 概念以及构建技术专知
[http://mp.weixin.qq.com/s/bhk6iZdphif74HJlyUZOBQ]

知识图谱综述: 构建技术与典型应用专知
[https://mp.weixin.qq.com/s/j1ub_exp-T7kk7snHs4eYw]

14.知识图谱相关会议之观后感分享与学习总结
[http://blog.csdn.net/eastmount/article/details/46672701]
- PPT: [http://download.csdn.net/detail/eastmount/9159689]

Tutorial

知识图谱导论刘康韩先培 [http://cips-upload.bj.bcebos.com/ccks2017/upload/CCKS2017V5.pdf]
知识图谱构建邹磊徐波 [http://cips-upload.bj.bcebos.com/ccks2017/upload/zl.pdf]
知识获取方法劳逆邱锡鹏 [http://cips-upload.bj.bcebos.com/ccks2017/upload/2017-ccks-Knowledge-Acquisition-.pdf]
行业知识图谱构建与应用101 王昊奋胡芳槐 [http://cips-upload.bj.bcebos.com/ccks2017/upload/CCKS-2017-%E8%A1%8C%E4%B8%9A%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E4%B8%8E%E5%BA%94%E7%94%A8101.pdf]
知识图谱学习小组学习 • 第一期w1：知识提取 • 第一期w2：知识表示 • 第一期w3：知识存储 • 第一期w4：知识检索 [https://github.com/memect/kg-beijing]
深度学习与知识图谱刘知远韩先培 CCL2016 [http://www.cips-cl.org/static/CCL2016/tutorialpdf/T2A_%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1_part3.pdf]
中文知识图谱-复旦大学
- [http://gdm.fudan.edu.cn/GDMWiki/attach/Yanghuaxiao/ckg_italk.pdf]
Martin Ringsquandl,Semantic-guided Predictive Modeling and Relational Learning within Industrial Knowledge Graphs,156页pdf

课程

东南大学《知识图谱》研究生课程
- [https://github.com/npubird/KnowledgeGraphCourse]
浙江大学《知识图谱》课程
- 知识图谱的早期理念源于万维网之父 Tim Berners Lee 关于语义网(The Semantic Web) 的设想，旨在采用图的结构(Graph Structure)来建模和记录世界万物之间的关联关系和知识，以便有效实现更加精准的对象级搜索。经过近二十年的发展，知识图谱的相关技术已经在搜索引擎、智能问答、语言及视觉理解、大数据决策分析、智能设备物联等众多领域得到广泛应用，被公认为是实现认知智能的重要基石。近年来，随着自然语言处理、深度学习、图数据处理等众多领域的飞速发展，知识图谱在自动化知识获取、基于知识的自然语言处理、基于表示学习的机器推理、基于图神经网络的图挖掘与分析等领域又取得了很多新进展。本课程是面向浙江大学研究生开设的专业选修课程。课程系统性介绍知识图谱的基本概念、核心技术内涵和应用实践方法，具体内容涉及知识表示与推理、图数据库、关系抽取与知识图谱构建、知识图谱表示学习与嵌入、语义搜索与知识问答、图神经网络与图挖掘分析等。课程内容的设计以“基础、前沿与实践”相结合为基本原则，既包括基本概念介绍和实践应用内容，也包括学术界的最新前沿进展的介绍。 [https://person.zju.edu.cn/huajun#kg]
复旦大学知识图谱暑期课程，2018年本次课程体系由复旦大学肖仰华教授策划，讲者来自复旦大学、南加州大学、湖南大学、香港中文大学、华东师范大学、微软亚洲研究院、上海财经大学、东华大学、苏州大学等青年学者。本次课程由上海财经大学承办，由上海财经大学崔万云博士负责课程的本地组织工作。 [百度云链接：https://pan.baidu.com/s/11DdkfxN4JG_naD1ySkIHeQ, 密码：r5d3]

Datasets

DBpedia DBpedia 是一个大规模的多语言百科知识图谱，可视为是维基百科的结构化版本。DBpedia 使用固定的模式对维基百科中的实体信息进行抽取，包括 abstract、infobox、category 和 page link 等信息。图 2 示例了如何将维基百科中的实体“Busan”的 infobox 信息转换成 RDF 三元组。DBpedia 目前拥有 127 种语言的超过两千八百万个实体与数亿个 RDF 三元组，并且作为链接数据的核心，与许多其他数据集均存在实体映射关系。而根据抽样评测，DBpedia 中 RDF 三元组的正确率达 88%。DBpedia 支持数据集的完全下载。 [http://wiki.dbpedia.org/]
Yago 是一个整合了维基百科与 WordNet的大规模本体，它首先制定一些固定的规则对维基百科中每个实体的 infobox 进行抽取，然后利用维基百科的category进行实体类别推断（Type Inference）获得了大量的实体与概念之间的 IsA 关系（如：“Elvis Presley” IsA “American Rock Singers”），最后将维基百科的 category 与 WordNet 中的 Synset（一个 Synset 表示一个概念）进行映射，从而利用了 WordNet 严格定义的 Taxonomy 完成大规模本体的构建。随着时间的推移，Yago 的开发人员为该本体中的 RDF 三元组增加了时间与空间信息，从而完成了 Yago2的构建，又利用相同的方法对不同语言维基百科的进行抽取，完成了 Yago3的构建。目前，Yago 拥有 10 种语言约 459 万个实体，2400 万个 Facts，Yago 中 Facts的正确率约为 95%。Yago 支持数据集的完全下载。 [https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/]
Wikidata WikiData的目标是构建一个免费开放、多语言、任何人或机器都可以编辑修改的大规模链接知识库。WikiData由维基百科于2012年启动，早期得到微软联合创始人Paul Allen、Gordon Betty Moore基金会以及Google的联合资助。WikiData继承了Wikipedia的众包协作的机制，但与Wikipedia不同，WikiData支持的是以三元组为基础的知识条目（Items）的自由编辑。一个三元组代表一个关于该条目的陈述（Statements）。例如可以给“地球”的条目增加“<地球，地表面积是，五亿平方公里>”的三元组陈述。截止2016年，WikiData已经包含超过2470多万个知识条目。 [https://www.wikidata.org/wiki/Wikidata:Main_Page]
BabelNet 是目前世界范围内最大的多语言百科同义词典，它本身可被视为一个由概念、实体、关系构成的语义网络（Semantic Network）。BabelNet 目前有超过 1400 万个词目，每个词目对应一个 synset。每个 synset 包含所有表达相同含义的不同语言的同义词。比如：“中国”、“中华人民共和国”、“China”以及“people’srepublic of China”均存在于一个 synset 中。BabelNet 由 WordNet 中的英文 synsets 与维基百科页面进行映射，再利用维基百科中的跨语言页面链接以及翻译系统，从而得到 BabelNet 的初始版本。目前 BabelNet 又整合了 Wikidata、GeoNames、OmegaWiki 等多种资源，共拥有 271 个语言版本。由于 BabelNet 中的错误来源主要在于维基百科与 WordNet 之间的映射，而映射目前的正确率大约在 91%。关于数据集的使用，BabelNet 目前支持 HTTP API 调用，而数据集的完全下载需要经过非商用的认证后才能完成。 [http://babelnet.org/]
ConceptNet 是一个大规模的多语言常识知识库，其本质为一个以自然语言的方式描述人类常识的大型语义网络。ConceptNet 起源于一个众包项目 Open Mind Common Sense，自 1999 年开始通过文本抽取、众包、融合现有知识库中的常识知识以及设计一些游戏从而不断获取常识知识。ConceptNet 中共拥有 36 种固定的关系，如 IsA、UsedFor、CapableOf 等，图 4 给出了一个具体的例子，从中可以更加清晰地了解 ConceptNet 的结构。ConceptNet 目前拥有 304 个语言的版本，共有超过 390 万个概念，2800 万个声明（statements，即语义网络中边的数量），正确率约为 81%。另外，ConceptNet 目前支持数据集的完全下载。 [http://conceptnet.io/]
Microsoft Concept Graph 是一个大规模的英文 Taxonomy，其中主要包含的是概念间以及实例（等同于上文中的实体）概念间的 IsA 关系，其中并不区分 instanceOf 与 subclassOf 关系。Microsoft Concept Graph 的前身是 Probase，它过自动化地抽取自数十亿网页与搜索引擎查询记录，其中每一个 IsA 关系均附带一个概率值，即该知识库中的每个 IsA 关系不是绝对的，而是存在一个成立的概率值以支持各种应用，如短文本理解、基于 taxonomy 的关键词搜索和万维网表格理解等。目前，Microsoft Concept Graph 拥有约 530 万个概念，1250 万个实例以及 8500 万个 IsA 关系（正确率约为 92.8%）。关于数据集的使用，MicrosoftConcept Graph 目前支持 HTTP API 调用，而数据集的完全下载需要经过非商用的认证后才能完成。 [https://concept.research.microsoft.com/Home/Introduction]
Freebase: Freebase是一个开放共享的、协同构建的大规模链接数据库。Freebase是由硅谷创业公司MetaWeb于2005年启动的一个语义网项目。2010年，谷歌收购了Freebase作为其知识图谱数据来源之一。Freebase主要采用社区成员协作方式构建。其主要数据来源包括维基百科Wikipedia、世界名人数据库NNDB、开放音乐数据库MusicBrainz，以及社区用户的贡献等。Freebase基于RDF三元组模型，底层采用图数据库进行存储。Freebase的一个特点是不对顶层本体做非常严格的控制，用户可以创建和编辑类和关系的定义。2016年，谷歌宣布将Freebase的数据和API服务都迁移至Wikidata，并正式关闭了Freebase。 [https://developers.google.com/freebase/]
Schema.org：Schema.org是2011年起，由Bing、Google、Yahoo和Yandex等搜索引擎公司共同支持的语义网项目。Schema.org支持各个网站采用语义标签（Semantic Markup）的方式将语义化的链接数据嵌入到网页中。搜索引擎自动搜集和归集这些，快速的从网页中抽取语义化的数据。Schema.org提供了一个词汇本体用于描述这些语义标签。截止目前，这个词汇本体已经包含600多个类和900多个关系，覆盖范围包括：个人、组织机构、地点、时间、医疗、商品等。谷歌于2015年推出的定制化知识图谱支持个人和企业在其网页中增加包括企业联系方法、个人社交信息等在内的语义标签，并通过这种方式快速的汇集高质量的知识图谱数据。截止2016年，谷歌的一份统计数据显示，超过31%的网页和1200万的网站已经使用了Schema.org发布语义化的链接数据。其它采用了部分Schema.org功能的还包括微软Cortana、Yandex、Pinterest、苹果的Siri等。Schema.org的本质是采用互联网众包的方式生成和收集高质量的知识图谱数据。 [http://schema.org/]
LOD-Linked Open Data：LOD的初衷是为了实现Tim Berners-Lee在2006年发表的有关链接数据（Linked Data）作为语义网的一种实现的设想。LOD遵循了Tim提出的进行数据链接的四个规则，即：（1）使用URI标识万物；（2）使用HTTP URI，以便用户可以（像访问网页一样）查看事物的描述；（3）使用RDF和SPARQL标准；（4）为事物添加与其它事物的URI链接，建立数据关联。截止目前，LOD已经有1143个链接数据集，其中社交媒体、政府、出版和生命科学四个领域的数据占比超过90%。56% 的数据集对外至少与一个数据集建立了链接。被链接最多的是dbpedia的数据。比较常用的链接类型包括：foaf:knows、sioc:follows、owl:sameAs、rdfs:seeAlso、dct:spatial、skos:exactMatch等。LOD鼓励各个数据集使用公共的开放词汇和术语，但也允许使用各自的私有词汇和术语。在使用的术语中，有41%是公共的开放术语 [http://lod-cloud.net/]
WordNet：语言知识图谱，包含155, 327个单词，同义词集117,597个，同义词集之间由22种关系连接 [https://wordnet.princeton.edu/]
Zhishi.me ：Zhishi.me是中文常识知识图谱。主要通过从开放的百科数据中抽取结构化数据，已融合了百度百科，互动百科以及维基百科中的中文数据。 [http://zhishi.me/]
CN-DBPeidia：CN-DBpedia是由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科。CN-DBpedia主要从中文百科类网站（如百度百科、互动百科、中文维基百科等）的纯文本页面中提取信息，经过滤、融合、推断等操作后，最终形成高质量的结构化数据，供机器和人使用。CN-DBpedia自2015年12月份发布以来已经在问答机器人、智能玩具、智慧医疗、智慧软件等领域产生数亿次API调用量。CN-DBpedia提供全套API，并且免费开放使用。大规模商务调用，提供由IBM、华为支持的专业、稳定服务接口。 [http://kw.fudan.edu.cn/cndbpedia/search/]
Medical Relation Detection Dataset in DIEBOLDS 一个医疗健康领域的知识图谱数据集，可以用来做医疗实体的抽取和检测，比如药物、成分、症状和疾病。 Lidong Bing 邴立东 [http://www.cs.cmu.edu/~lbing/#Datasets]
Kinships：领域知识图谱，描述人物之间的亲属关系，104个实体， 26种关系, 10,800个三元组。 [https://archive.ics.uci.edu/ml/datasets/kinship]
UMLS：领域知识图谱，医学领域，描述医学概念之间的联系，135 个实体，49种关系，6,800个三元组。 [https://www.nlm.nih.gov/research/umls/]
XLORE双语百科知识图谱 XLore从异构的跨语言在线百科中抽取结构化信息，并将其分享在网络上。据我们所知，XLore是第一个大规模的中英文知识平衡的知识图谱。目前，XLore包含663,740个概念，56,449个属性和10,856,042个实例。这给构建任何双语言知识平衡的大规模知识图谱提供了一种新的方式。 [http://xlore.org/]
Knowledge Vault: 机器自动构建的知识图谱，4500万实体，4469种关系，2.7亿三元组 [https://research.google.com/pubs/pub45634.html]
ConceptNet5 ConceptNet是常识知识库。最早源于MIT媒体实验室的Open Mind Common Sense (OMCS)项目。OMCS项目是由著名人工智能专家Marvin Minsky于1999年建议创立。ConceptNet主要依靠互联网众包、专家创建和游戏三种方法来构建。ConceptNet知识库以三元组形式的关系型知识构成。ConceptNet5版本已经包含有2800万关系描述。与Cyc相比，ConceptNet采用了非形式化、更加接近自然语言的描述，而不是像Cyc那样采用形式化的谓词逻辑。与链接数据和谷歌知识图谱相比，ConceptNet比较侧重于词与词之间的关系。从这个角度看，ConceptNet更加接近于WordNet，但是又比WordNet包含的关系类型多。此外，ConceptNet完全免费开放，并支持多种语言。 [http://www.openkg.cn/dataset/conceptnet5-chinese]
史上最大规模1.4亿中文知识图谱开源下载本次ownthink开源了史上最大规模的中文知识图谱，数据是以（实体、属性、值），（实体、关系、实体）混合的形式组织， [https://github.com/ownthink/KnowledgeGraphData]

项目案例

金融领域知识图谱
- 利用网络上公开的数据构建一个小型的证券知识图谱/知识库 [https://github.com/lemonhu/stock-knowledge-graph.git]
- 上市公司高管图谱 [https://github.com/Shuang0420/knowledge_graph_demo]
医疗领域知识图谱
农业领域知识图谱
- 使用爬虫获取Wikidata数据构建 [https://github.com/CrisJk/Agriculture-KnowledgeGraph-Data.git]

进阶论文

1991

sowa J F. Principles of semantic networks: Exploration in the representation of Knowledge[J]. Frame Problem in Artificial Intelligence, 1991(2-3):135–157.
[https://www.researchgate.net/publication/230854809_Principles_of_Semantic_Networks_Exploration_in_the_Representation_of_Knowledge]

1998

brin s. Extracting Patterns and relations from the World Wide Web[J]. lecture notes in computer Science, 1998, 1590:172-183 [Extracting Patterns and relations from the World Wide Web]

2001

Berners-Lee T, Hendler J, Lassila O. The semantic Web: A new Form of Web content that is Meaningful to computers will Unleash a revolution of New Possibilities[J]. Scientific American, 2001, 284(5):34-43.
[http://xitizap.com/semantic-web.pdf]

2005

Guodong Z, Jian S, Jie Z, et al. Exploring Various Knowledge in relation Extraction.[c]// ACL 2005, Meeting of the Association for Computational Linguistics, Proceedings of the Conference, 2530 June, 2005, University of Michigan, USA. DBLP. 2005:419-444.
[https://dl.acm.org/citation.cfm?id=1219893]

2008

Suchanek F M, Kasneci G, Weikum G. YAGO: A large ontology from Wikipedia and Wordnet[J]. Web semantics science services and agents on the World Wide Web, 2008, 6(3):203-217.
[http://www.sciencedirect.com/science/article/pii/S1570826808000437]

2009

Brachman R J, Borgida A, Mcguinness D L, et al. " Reducing" CLASSIC to Practice: Knowledge representation theory Meets reality[c]// conceptual Modeling: Foundations and applications. springerVerlag. 2009:436-465.
[http://www.sciencedirect.com/science/article/pii/S0004370299000788]
Hellmann S, Lehmann J, Auer S. Learning of oWl class Descriptions on Very large Knowledge bases[J]. international Journal on semantic Web and Information Systems, 2009, 5(5):25-48.
[http://wifo5-03.informatik.uni-mannheim.de/bizer/pub/iswc2008pd-bak/iswc2008pd_submission_83.pdf]
lehmann J. Dl-learner: learning concepts in Description logics[J]. Journal of Machine learning Research, 2009, 10(6):2639-2642.
[http://dl.acm.org/citation.cfm?id=1755874]

2010

Kate R J, Mooney R J. Joint Entity and relation Extraction using card-pyramid Parsing[c]// C onference on C omputational N atural L anguage learning. 2010:203-212.
[http://www.cse.fau.edu/~xqzhu/courses/cap6777/Joint.Named.Entity.kate.conll10.pdf]
Carlson A, Betteridge J, Kisiel B, et al. Toward an architecture for N ever-Ending language learning. [ C ]// twenty-Fourth AAAI C onference on A rtificial Intelligence, AAAI 2010, Atlanta, Georgia, Usa, July. DBLP, 2010:529-573.
[https://www.aaai.org/ocs/index.php/AAAI/AAAI10/paper/view/1879]
Navigli R, Ponzetto S P. BabelNet: Building a very Large Multilingual S emantic Network[ C ]// annual Meeting of the association for computational linguistics. 2010:216-225.
[https://dl.acm.org/citation.cfm?id=1858704]

2011

Hu W, Chen J, Qu Y. A Self-training Approach for resolving object coreference on the semantic Web[ C ]// I nternational C onference on World Wide Web. ACM, 2011:87-96.
[https://dl.acm.org/citation.cfm?id=1963421]
Han X, Sun L. A Generative Entity-Mention Model for linking Entities with Knowledge base[c]// T he Meeting of the A ssociation for C omputational Linguistics: Human Language Technologies, Proceedings of the Conference, 19-24 June, 2011, Portland, Oregon, USA. DBLP, 2011:945-954.
[https://dl.acm.org/citation.cfm?id=2002592]
Zhang W, Sim Y C, Su J, et al. Entity Linking with Effective Acronym Expansion, Instance Selection and topic Modeling[c]// international Joint conference on Artificial Intelligence. 2011:1909-1914.
[http://www.aaai.org/ocs/index.php/IJCAI/IJCAI11/paper/view/3392]
Han X, Sun L, Zhao J. Collective Entity Linking in Web text: A Graph-based Method[c]// Proceeding of the international acM siGir conference on research and Development in Information Retrieval, SIGIR 2011, Beijing, China, July. DBLP, 2011:765-774.
[https://dl.acm.org/citation.cfm?id=2010019]
Nickel M, Tresp V, Kriegel H P. A Three-Way Model for collective learning on Multi-relational Data. [C]// International Conference on Machine Learning, ICML 2011, Bellevue, Washington, Usa, June 28 July. DBLP, 2011:809-816.
[http://www.icml-2011.org/papers/438_icmlpaper.pdf]
Bordes A, Weston J, Collobert R, et al. Learning structured Embeddings of Knowledge bases[c]// AAAI Conference on Artificial Intelligence, AAAI 2011, San Francisco, California, Usa, August. DBLP, 2011:301-306.
[http://www.aaai.org/ocs/index.php/AAAI/AAAI11/paper/view/3659]
Lao N, Mitchell T, Cohen W W. Random Walk inference and learning in a large scale Knowledge base[c]// conference on Empirical Methods in natural Language Processing, EMNLP 2011, 27-31 July 2011, John Mcintyre Conference Centre, Edinburgh, Uk, A Meeting of Sigdat, A Special Interest Group of the ACL. DBLP, 2011:529-539.
[https://dl.acm.org/citation.cfm?id=2145494]

2013

Li J, Wang Z, Zhang X, et al. Large Scale instance Matching via Multiple indexes and candidate Selection[J]. Knowledge-Based Systems, 2013, 50(3):112-120.
[http://disi.unitn.it/~p2p/RelatedWork/Matching/KBS13-Li-et-al-large-instance.pdf]
. Shen W, Wang J, Luo P, et al. Linking Named Entities in tweets with Knowledge Base via User Interest Modeling[ C ]// AC M SI GKDD I nternational C onference on Knowledge Discovery and Data Mining. ACM, 2013:68-76.
[https://dl.acm.org/citation.cfm?id=2487686]
Alhelbawy A, Gaizauskas R. Graph Ranking for collective named Entity Disambiguation[c]// Meeting of the Association for Computational L inguistics. 2014:75-80.
[http://www.anthology.aclweb.org/P/P14/P14-2013.pdf]
He Z, Liu S, Li M, et al. Learning Entity representation for Entity Disambiguation[J]. annual Meeting of the A ssociation for C omputational Linguistics, 2013, (2):30-34.
[http://www.doc88.com/p-9039715083540.html]

2014

Miwa M, Sasaki Y. Modeling Joint Entity and Relation Extraction with table R epresentation[ C ]// C onference on Empirical Methods in N atural Language Processing. 2014:944-948.
[http://www.anthology.aclweb.org/D/D14/D14-1200.pdf]
Li Q, Ji H. Incremental Joint Extraction of Entity Mentions and relations[c]// annual Meeting of the Association for Computational Linguistics. 2014:402-412.
[http://www.anthology.aclweb.org/P/P14/P14-1038.pdf]
Mitchell T, Fredkin E. Never-ending Language L earning[M]// N ever-Ending L anguage L earning. Alphascript Publishing, 2014.
[http://www.ischool.drexel.edu/bigdata/bigdata2014/NELL_Mitchell_IEEE_Oct2014_distr.pdf]
Vrande, Denny, Tzsch M. Wikidata: A Free collaborative Knowledge base[J]. communications of the ACM, 2014, 57(10):78-85.
[https://cacm.acm.org/magazines/2014/10/178785-wikidata/fulltext]

2015

Hashimoto K, Stenetorp P, Miwa M, et al. Taskoriented learning of Word Embeddings for semantic Relation Classification[J], Computer Science, 2015:268-278.
[http://arxiv.org/abs/1503.00095]
Wang H, Fang Z, Zhang L, et al. Effective Online Knowledge Graph Fusion[M]// the semantic Web ISWC 2015. Springer International Publishing, 2015: 286-302.
[http://iswc2015.semanticweb.org/sites/iswc2015.semanticweb.org/files/93660257.pdf]
Otero-Cerdeira L, Rodríguez-Martínez F J, Gómez-Rodríguez A. Ontology Matching: A Literature Review[J]. Expert Systems with Applications, 2015, 42(2):949–971.
[http://disi.unitn.it/~p2p/RelatedWork/Matching/Cerdeira-Ontology%20Matching-2015.pdf]
Huang H, Heck L, Ji H. Leveraging Deep neural networks and Knowledge Graphs for Entity Disambiguation[J]. Computer Science, 2015:1275-1284. [http://arxiv.org/abs/1504.07678]
Zhou Z, Qi G, Wu Z, et al. A Platform-Independent A pproach for Parallel Reasoning with OWLEL Ontologies Using Graph Representation[C]// IEEE, I nternational C onference on TOOLS with A rtificial Intelligence. IEEE, 2015:80-87.
[http://ieeexplore.ieee.org/xpls/icp.jsp?arnumber=7372121]
Galárraga L, Teflioudi C, Hose K, et al. Fast Rule Mining in ontological Knowledge bases with aMiE+[J]. The VLDB Journal, 2015, 24(6):707-730. [https://dl.acm.org/citation.cfm?id=2846643]

2016

Miwa M, Bansal M. End-to-End Relation Extraction using LSTMs on S equences and tree structures[c]// annual Meeting of the association for computational linguistics. 2016:1105-1116.
[https://arxiv.org/abs/1601.00770]
Nickel M, Murphy K, Tresp V, et al. A Review of relational Machine learning for Knowledge Graphs[J]. Proceedings of the IEEE, 2016, 104(1):11-33. [http://arxiv.org/abs/1503.00759]
Nickel M, Rosasco L, Poggio T. Holographic Embeddings of Knowledge Graphs[J]// AAAI Conference on Artificial Intelligence. 2016:1955-1961. [http://arxiv.org/abs/1510.04935]

2017

Baoxu Shi, Tim Weninger: ProjE: Embedding Projection for Knowledge Graph Completion. AAAI 2017: 1236-1242
Rakshit Trivedi, Hanjun Dai, Yichen Wang, Le Song: Know-Evolve: Deep Temporal Reasoning for Dynamic Knowledge Graphs. ICML 2017: 3462-3471

2018

Baoxu Shi, Tim Weninger: Open-World Knowledge Graph Completion. AAAI 2018: 1957-1964
Beilun Wang, Arshdeep Sekhon, Yanjun Qi: A Fast and Scalable Joint Estimator for Integrating Additional Knowledge in Learning Multiple Related Sparse Gaussian Graphical Models. ICML 2018: 5148-5157
Keyulu Xu, Chengtao Li, Yonglong Tian, Tomohiro Sonobe, Ken-ichi Kawarabayashi, Stefanie Jegelka: [Representation Learning on Graphs with Jumping Knowledge Networks] (http://proceedings.mlr.press/v80/xu18c.html). ICML 2018: 5449-5458

2019

Antoine Bosselut, Hannah Rashkin, Maarten Sap, Chaitanya Malaviya, Asli Çelikyilmaz, Yejin Choi: COMET: Commonsense Transformers for Automatic Knowledge Graph Construction. ACL (1) 2019: 4762-4779
Lingbing Guo, Zequn Sun, Wei Hu: Learning to Exploit Long-term Relational Dependencies in Knowledge Graphs. ICML 2019: 2505-2514
Tianwen Jiang, Tong Zhao, Bing Qin, Ting Liu, Nitesh V. Chawla, Meng Jiang: The Role of: A Novel Scientific Knowledge Graph Representation and Construction Model. KDD 2019: 1634-1642

2020

Jian Xu, Sunkyu Kim, Min Song, Minbyul Jeong, Donghyeon Kim, Jaewoo Kang, Justin F. Rousseau, Xin Li, Weijia Xu, Vetle I. Torvik, Yi Bu, Chongyan Chen, Islam Akef Ebeid, Daifeng Li & Ying Ding: Building a PubMed knowledge graph. Scientific Data volume 7,205(2020)
Hongming Zhang, Xin Liu, Haojie Pan, Yangqiu Song, Cane Wing-Ki Leung: ASER: A Large-scale Eventuality Knowledge Graph. WWW2020 (2020)
Liu, W., Zhou, P., Zhao, Z., Wang, Z., Ju, Q., Deng, H., & Wang, P. : K-BERT: Enabling Language Representation with Knowledge Graph. AAAI2020,34(03):2901-2908(2020)
Hongming Zhang, Xin Liu, Haojie Pan, Yangqiu Song, Cane Wing-Ki Leung: ASER: A Large-scale Eventuality Knowledge Graph. WWW2020 (2020)
Sebastian R. Bader,Irlan Grangel-Gonzalez,Priyanka Nanjappa,Maria-Esther Vidal,Maria Maleshkova: A Knowledge Graph for Industry 4.0. ESWC 2020 (2020)
SoYeopYoo,OkRanJeong: Automating the expansion of a knowledge graph.Expert Systems with Applications 141(2020)
Ines Chami, Adva Wolf, Da-Cheng Juan, Frederic Sala, Sujith Ravi, Christopher Ré: Low-Dimensional Hyperbolic Knowledge Graph Embeddings.(2020)