【北大深研院】构建材料知识图谱及以此预测新型锂电池材料

2022 年 4 月 27 日 专知

来源:


前言

经过长时间的发展,大量的材料学术文献积累了丰富的科学成果,以文本形式散布在文献中的科学知识一般仍由研究人员手动收集和分析,这通常十分耗时且难以保证信息的完整度。如果将文献中的材料科学信息表示为结构化的知识,再结合知识关联、融合、推理等方法,构建材料知识图谱,可以使研究人员准确而又高效地获取信息,并对过往研究进行脉络梳理,对有潜力的材料进行剖析。


北京大学深圳研究生院新材料学院潘锋教授课题组近年来致力于构建材料知识图谱以及解决其关键科学问题和技术难题,发展了一套高精度且高效的同名消歧以及信息搜索框架,在材料科学领域建立主体(作者)与客体(材料)之间的对应关系,结合机器学习和依赖匹配算法,构建名为MatKG的材料知识图谱,并对锂离子电池正极材料LiFePO4进行自动化分析,生成其发展里程碑,追踪其研究趋势,相关成果已发表于《先进能源材料》(Advanced Energy Materials, DOI:10.1002/aenm.202003580)。


在此基础上,潘锋课题组进一步深入研究材料知识图谱的构建技术和应用潜力,实现了对隐藏在文本中的潜在材料关联的挖掘,进一步实现了材料的推理预测。


近日,他们在《先进功能材料》杂志(Advanced Functional Materials, DOI:10.1002/adfm.202201437)发表题为“Automating Materials Exploration with a Semantic Knowledge Graph for Li-ion Battery Cathodes”的研究论文。该研究提出了一种可实现材料科学知识嵌入的语义表示框架,通过多源信息融合提高材料实体的表示质量以对材料科学文献中的锂离子电池正极材料实体进行精准挖掘并构建正极材料知识图谱,预测高性能锂电池材料。该工作在几乎不需要领域知识的情况下,实现了复杂材料系统的基于文本挖掘的高效知识融合和推理与预测,将助力实现数据驱动的材料研究新范式。


材料科学文本中包含大量非结构化、高度异构形式的材料科学信息,并且材料子领域拥有特定的领域知识,不同子领域之间差异明显,这都对材料科学知识的精准挖掘造成了极大的挑战。由于数据驱动的材料研发新范式的应用价值,构建整合材料特性和应用信息的数据管理平台成为了目前迫切的需求,而基于文本挖掘的材料知识图谱构建及材料推理预测正是解决这一需求的重要手段。


课题组发展了一套名为DATWEM的材料信息语义表示框架,以针对性生成特定子领域的材料实体表示,解决了复杂材料系统中的材料实体挖掘问题。该框架结合BiLSTM和双重注意力机制,通过多源信息融合提高词嵌入的质量,以对材料科学文献中的特定领域材料实体进行精准挖掘。他们将该框架应用于锂离子电池正极材料领域知识图谱的构建:首先对材料科学文本信息进行向量化;接下来使用两个独立的词嵌入模块对两种不同语料库(无机材料语料库和正极材料语料库)分别进行编码,两种语料库编码后的词嵌入和关键词模块的词嵌入随后会被输入DATWEM框架经过双层注意力模块实现多源信息融合,增强材料实体的表示质量;最后量化材料实体之间的相似度以构建锂离子电池正极材料知识图谱。


材料知识图谱的构建流程


课题组在该知识图谱的基础上进行潜在正极材料的推理预测,通过无监督聚类对不同材料之间的语义相似性进行可视化,保留与四种代表性正极材料(LiCoO2、LiFePO4、LiMn2O4、Li2MnO3)相关的较大聚类簇。在对已包含在语料库中的正极材料进行过滤后,他们发现了一种潜在的正极材料——Li2TiMn3O8,该材料与典型正极材料LiCoO2通过层状结构这一明显共同特征形成直接连接路径,通过包含适合用于正极材料的可变价元素这一潜在共同特征形成间接连接路径,从而根据直接及间接路径实现了该潜在材料的发现。

材料知识图谱用于锂电池正极材料的发现


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“MKGL” 就可以获取【北大深研院】构建材料知识图谱及以此预测新型锂电池材料》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取70000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取70000+AI主题知识资料
登录查看更多
1

相关内容

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
SIGIR2022|基于注意力超图网络的交互协同聚类
专知会员服务
24+阅读 · 2022年5月14日
专知会员服务
146+阅读 · 2021年8月26日
专知会员服务
122+阅读 · 2021年6月12日
专知会员服务
31+阅读 · 2021年5月7日
知识图谱在智能制造领域的研究现状及其应用前景综述
专知会员服务
151+阅读 · 2021年2月25日
【KDD 2020】基于互信息最大化的多知识图谱语义融合
专知会员服务
39+阅读 · 2020年9月7日
基于知识图谱的推荐系统研究综述
专知会员服务
321+阅读 · 2020年8月10日
一文总结多样化推荐研究趋势
机器学习与推荐算法
0+阅读 · 2021年11月17日
基于知识图谱的推荐系统总结
图与推荐
1+阅读 · 2021年11月11日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
Github六个知识图谱实战项目推荐
专知
379+阅读 · 2019年6月2日
知识图谱的系统工程观
中国计算机学会
18+阅读 · 2018年11月13日
【知识图谱】中医临床知识图谱的构建与应用
产业智能官
59+阅读 · 2017年12月18日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Hybrid Physical Metric For 6-DoF Grasp Pose Detection
Arxiv
28+阅读 · 2021年9月26日
Arxiv
12+阅读 · 2021年5月3日
Arxiv
12+阅读 · 2018年1月12日
VIP会员
相关VIP内容
SIGIR2022|基于注意力超图网络的交互协同聚类
专知会员服务
24+阅读 · 2022年5月14日
专知会员服务
146+阅读 · 2021年8月26日
专知会员服务
122+阅读 · 2021年6月12日
专知会员服务
31+阅读 · 2021年5月7日
知识图谱在智能制造领域的研究现状及其应用前景综述
专知会员服务
151+阅读 · 2021年2月25日
【KDD 2020】基于互信息最大化的多知识图谱语义融合
专知会员服务
39+阅读 · 2020年9月7日
基于知识图谱的推荐系统研究综述
专知会员服务
321+阅读 · 2020年8月10日
相关资讯
一文总结多样化推荐研究趋势
机器学习与推荐算法
0+阅读 · 2021年11月17日
基于知识图谱的推荐系统总结
图与推荐
1+阅读 · 2021年11月11日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
Github六个知识图谱实战项目推荐
专知
379+阅读 · 2019年6月2日
知识图谱的系统工程观
中国计算机学会
18+阅读 · 2018年11月13日
【知识图谱】中医临床知识图谱的构建与应用
产业智能官
59+阅读 · 2017年12月18日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员