大型语言模型(LLMs)在广泛的自然语言处理任务中展现出了卓越的性能。然而,时间推理,尤其是在复杂时间约束下的推理,仍然是一项重大挑战。为此,现有方法探索了两类方向:其一是符号方法,通过显式编码时间结构来处理时间关系;其二是反思机制,通过多步推理对推理错误进行修正。然而,符号方法往往未能充分发挥 LLM 的推理能力,而反思方法通常缺乏结构化的时间表示,这可能导致推理不一致或产生幻觉式结论。因此,即便正确的时间上下文已具备,LLMs 仍可能误解或误用时间信息,从而导致答案不完整或不准确。
为克服这些局限性,我们提出 Neuro-Symbolic Temporal Reasoning (NeSTR),一种将结构化符号表示与混合式反思推理相结合的新型框架,用于增强 LLM 推理过程中的时间敏感性。NeSTR 通过符号编码保留显式的时间关系,通过验证机制强化逻辑一致性,并通过溯因式反思(abductive reflection)纠正有缺陷的推理。我们在多个时间类问答基准上的大量实验表明,NeSTR 在零样本设置下取得了更优性能,并在无需任何微调的情况下持续提升时间推理质量,展示了神经-符号融合在增强大型语言模型时间理解能力方面的显著优势。