表格问答研究综述

表格问答通过自然语言问句直接与表格数据进行交互并得到答案,是智能问答的主要形式之一。近年来,研究人员利用以语义解析为主的技术在该领域开展了深入研究。该文从不同表格类型分类及其问答任务问题定义出发,将表格问答细分为单表单轮、多表单轮、多表多轮式问答三种任务,并系统介绍了各类表格问答任务的数据集及其代表性方法。其次,该文总结了当前主流表格预训练模型的数据构造、输入编码以及预训练目标。最后,探讨当前工作的优势与不足,并分析了未来表格问答的前景与挑战。

随着信息化系统在众多行业广泛应用,电子文档中嵌入的各类型表格及关系数据库表承载了丰富的信息,成为支撑领域信息交互和智能决策的重要数据基础[1]。例如,医疗领域已积累了海量的电子病历文档,其中蕴含了大量的表格信息。如何准确、快速地从中挖掘出有价值的医学信息,为疾病风险评估、智能辅助诊疗及医疗知识问答等提供支撑,已成为智慧医疗研究领域的重要任务[2]。在桥梁管理养护领域,定期检测报告中存在大量表格,众多桥梁管理信息系统的数据库表中也记录了细粒度结构病害、养护建议等信息,是实现桥梁智能管养的重要基础[3]。目前,以SQL为典型代表的结构化查询语言是访问关系型数据库表数据的主要途径,但普通系统用户不具备编写SQL语句的技术基础[4]。因此, 如何使用自然语言等交互方式,实现表格信息智能检索与问答,已成为学术界和产业界关注的热点问题之一。现有解决方案主要采用语义解析的方式实现用户问题与表格数据的交互。其中,Test-to-SQL 是其关键技术。该类方法主要实现从自然语言问句到SQL查询语句的映射,并将生成的 SQL 语句输入到SQL引擎中检索出对应的答案。因此,Textto-SQL映射准确率直接影响了其问答效果。

智能问答作为人工智能研究的一项重要任务,综合运用了自然语言处理、深度神经网络及知识图谱等多种方法。其中,知识图谱问答以基于三元组结构的语义网络为数据源通过信息检索或语义解析两种模式实现交互式问答[5]。例如,信息检索式知识图谱问答首先识别问题主题词,并通过实体匹配和答案生成等步骤完成问答任务。以文本段落作为数据源的机器阅读理解任务要求计算机根据给定上下文回答特定问题,也是智能问答领域研究热点之一[6]。表格信息抽取任务主要从表格数据中抽取语义一致的结构化信息,是知识图谱构建等任务的基础。另外,表格问答以文档表格、数据库表等为数据源,将自然语言问题语句与表格中的结构化或半结构化信息相匹配获取答案。表格问答不仅可以直观地回答自然语言问题,还可以通过排序、聚合等操作推理出复杂答案,具备较强实际应用价值。然而,与机器阅读理解和知识图谱问答相比,表格数据存储形式复杂、多样,在表格的上下文语义理解、问题解析与匹配等方面均面临更大挑战。如图1所示,表格问答最初以自然语言-数据库接口形式提出,但由于其复杂程度导致其在很长时间内发展相当缓慢。随着深度学习的发展,以 Text-to-SQL为主的语义解析成为研究热点。2017 年以来,随着 WiKiSQL [7] 数据集的发布,单表单轮式表格问答获得广泛关注。随着单表单轮式表格问答技术的日渐成熟,从实际应用出发的多表单轮式表格问答逐步兴起。随后, 与对话系统结合,表格问答扩展到多轮的形式。 2021年起,随着预训练模型在表格问答领域的探索,各类表格问答任务性能均得到大幅提升。目前,已有研究人员从不同角度对表格问答相关工作做出了总结回顾。李智等人[8]从语义解析的角度分析了基于表格知识库的问答模型、算法特点及其相关问题,但该综述仅介绍了传统的语义解析方法,未系统总结目前表格问答领域前沿的预训练模型等内容。Zhang等人[9]研究了 Web表格的提取、搜索、问答等任务,并指出不同任务之间的依赖关系,但该综述仅针对 Web表格,对其他表格形式尚未做出深入讨论,且表格问答任务未得到详细分析。Dong等人[10]从预训练模型角度出发,介绍了表格预训练模型设计、训练目标和下游任务,探讨了现有表格预训练模型,但未聚焦表格问答任务。 Qin等人[11]将 Text-to-SQL语料分为单轮和多轮, 分别总结其编码器和解码器架构,并详细阐述了现有预训练表格模型的预训练目标。梁清源等人[4]从 SQL生成场景、数据集、模型结构和评估方法层面对基于深度学习的 SQL 生成研究进行分类综述。但该文仅介绍了基于深度学习的SQL生成方法,未对传统的方法以及表格问答的发展脉络进行总结。与上述工作不同的是,本文从不同表格类型分类及其问答任务问题定义为出发点,系统性地总结各类表格问答任务的数据集及其代表性方法,介绍主流表格预训练模型,探讨当前工作的优势与不足, 展望表格问答研究的前景与挑战

成为VIP会员查看完整内容