知识图谱是否是 NLP 的未来？

Question

知识图谱是否是 NLP 的未来？

最近在空想，知识图谱是否是 NLP 的未来，如果神经网络自己能通过训练存储所有知识信息，也就没必要用知识图谱了？比如图像检测，就可以认为神经网络存储…

关注者

1,524

被浏览

445,143

登录后你可以

不限量看优质回答私信答主深度交流精彩内容一键收藏

查看全部 85 个回答

我认为知识图谱会在较长的时间内持续发光发热，但它很有可能不是NLP知识表示和理解的终极形态。

随着学术界对认知智能的关注，知识逐渐成为一个至关重要的元素。一般来说，神经模型主要捕获数据间的相关性，对于认知推理等复杂任务的表现较差。因此，知识作为认知推理的基础，在NLP的作用日渐凸显。知识图谱可以作为将知识融入神经模型的桥梁：首先从非结构化数据中抽取知识并表示为事实三元组，之后通过表示学习得到embedding，并进一步融入到神经模型中去。这是当前知识图谱应用的一个主流思路，具体细节可以参考：

当前的神经模型和知识图谱形成一种互利互惠的局面，如下图所示。一方面知识图谱的自动构建得益于基于神经模型的信息抽取；另一方面在神经模型中融入知识使得模型拥有更为优秀的表现。知识图谱已经在问答、推荐系统等领域取得了广泛的应用，相信在未来一段时间内将继续发光发热。

当前知识图谱的构建不存在太大的技术难度（虽然仍需大量人力成本），但是知识图谱如何更好地应用于NLP任务仍然是一个值得深思的问题。当前的主流方案，先构造embedding再融入模型中去，在构造embedding这一步就存在很大的信息损失。知识图谱发展的关键问题就是如何才能更好地将知识图谱用于NLP任务使其发挥最大效用，而这一点也将在NLP的未来中占有一席之地。

让我们把眼光放在更远的未来。首先，知识的明确定义在认识论中仍然是一个争论不休的话题。一般来说，知识具有一致性、公允性、实用性等性质，是人类从各个途径中获得的经过提升总结与凝练的系统的认识。知识图谱主要关注于事实知识这一部分，将知识表示为三元组的形式以描述实体间的关系。这种表示形式符合人类的直观认识，具有一定的表达能力，但也有较大的局限性。首先，对于模型来说，它仍然是“难以理解的符号”；其次，很多事实知识难以表现为三元组的形式；再者，知识图谱仅仅包含人类庞大知识系统中的一个孤立的部分，这种孤立的知识究竟能给模型带来多大的提升仍然不得而知。显然想解决上述问题，需要对知识乃至人类的认知过程有清晰的认识，需要像香农信息论之于信息一样对知识进行抽象建模。知识图谱更像是一种折衷——我们需要将模型引入知识，但是却难于构造出更好的知识表现形式。知识图谱是当前最有效的方案，但是我们也期待着更优雅的方案。

编辑于 2021-06-21 15:02

查看全部 85 个回答