知识图谱是否是 NLP 的未来?

最近在空想,知识图谱是否是 NLP 的未来,如果神经网络自己能通过训练存储所有知识信息,也就没必要用知识图谱了? 比如图像检测,就可以认为神经网络存储…
关注者
1,524
被浏览
445,143
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

我认为知识图谱会在较长的时间内持续发光发热,但它很有可能不是NLP知识表示和理解的终极形态。

随着学术界对认知智能的关注,知识逐渐成为一个至关重要的元素。一般来说,神经模型主要捕获数据间的相关性,对于认知推理等复杂任务的表现较差。因此,知识作为认知推理的基础,在NLP的作用日渐凸显。知识图谱可以作为将知识融入神经模型的桥梁:首先从非结构化数据中抽取知识并表示为事实三元组,之后通过表示学习得到embedding,并进一步融入到神经模型中去。这是当前知识图谱应用的一个主流思路,具体细节可以参考:

当前的神经模型和知识图谱形成一种互利互惠的局面,如下图所示。一方面知识图谱的自动构建得益于基于神经模型的信息抽取;另一方面在神经模型中融入知识使得模型拥有更为优秀的表现。知识图谱已经在问答、推荐系统等领域取得了广泛的应用,相信在未来一段时间内将继续发光发热。

当前知识图谱的构建不存在太大的技术难度(虽然仍需大量人力成本),但是知识图谱如何更好地应用于NLP任务仍然是一个值得深思的问题。当前的主流方案,先构造embedding再融入模型中去,在构造embedding这一步就存在很大的信息损失。知识图谱发展的关键问题就是如何才能更好地将知识图谱用于NLP任务使其发挥最大效用,而这一点也将在NLP的未来中占有一席之地。

让我们把眼光放在更远的未来。首先,知识的明确定义在认识论中仍然是一个争论不休的话题。一般来说,知识具有一致性、公允性、实用性等性质,是人类从各个途径中获得的经过提升总结与凝练的系统的认识。知识图谱主要关注于事实知识这一部分,将知识表示为三元组的形式以描述实体间的关系。这种表示形式符合人类的直观认识,具有一定的表达能力,但也有较大的局限性。首先,对于模型来说,它仍然是“难以理解的符号”;其次,很多事实知识难以表现为三元组的形式;再者,知识图谱仅仅包含人类庞大知识系统中的一个孤立的部分,这种孤立的知识究竟能给模型带来多大的提升仍然不得而知。显然想解决上述问题,需要对知识乃至人类的认知过程有清晰的认识,需要像香农信息论之于信息一样对知识进行抽象建模。知识图谱更像是一种折衷——我们需要将模型引入知识,但是却难于构造出更好的知识表现形式。知识图谱是当前最有效的方案,但是我们也期待着更优雅的方案。