Ontology-based knowledge graph (KG) construction is a core technology that enables multidimensional understanding and advanced reasoning over domain knowledge. Industrial standards, in particular, contain extensive technical information and complex rules presented in highly structured formats that combine tables, scopes of application, constraints, exceptions, and numerical calculations, making KG construction especially challenging. In this study, we propose a method that organizes such documents into a hierarchical semantic structure, decomposes sentences and tables into atomic propositions derived from conditional and numerical rules, and integrates them into an ontology-knowledge graph through LLM-based triple extraction. Our approach captures both the hierarchical and logical structures of documents, effectively representing domain-specific semantics that conventional methods fail to reflect. To verify its effectiveness, we constructed rule, table, and multi-hop QA datasets, as well as a toxic clause detection dataset, from industrial standards, and implemented an ontology-aware KG-RAG framework for comparative evaluation. Experimental results show that our method achieves significant performance improvements across all QA types compared to existing KG-RAG approaches. This study demonstrates that reliable and scalable knowledge representation is feasible even for industrial documents with intertwined conditions, constraints, and scopes, contributing to future domain-specific RAG development and intelligent document management.


翻译:基于本体的知识图谱构建是一项核心技术,能够实现对领域知识的多维度理解与高级推理。工业标准文档尤其包含大量以高度结构化格式呈现的技术信息与复杂规则,这些格式结合了表格、适用范围、约束条件、例外情况以及数值计算,使得知识图谱的构建尤为困难。本研究提出一种方法,将此类文档组织为层次化语义结构,将句子和表格分解为源自条件规则与数值规则的原子命题,并通过基于大语言模型的三元组抽取将其整合至本体-知识图谱中。该方法同时捕捉了文档的层次结构与逻辑结构,有效表征了传统方法难以反映的领域特定语义。为验证其有效性,我们从工业标准文档中构建了规则、表格、多跳问答数据集以及有毒条款检测数据集,并实现了一个本体感知的KG-RAG框架进行对比评估。实验结果表明,与现有的KG-RAG方法相比,我们的方法在所有问答类型上均取得了显著的性能提升。本研究证明,即使对于条件、约束与适用范围相互交织的工业文档,可靠且可扩展的知识表示也是可行的,这为未来领域特定的检索增强生成技术发展与智能文档管理提供了贡献。

0
下载
关闭预览

相关内容

【ICML2023】SEGA:结构熵引导的图对比学习锚视图
专知会员服务
22+阅读 · 2023年5月10日
专知会员服务
38+阅读 · 2021年9月15日
论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG
开放知识图谱
36+阅读 · 2018年3月30日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员