【工大SCIR】AAAI20 基于Goal(话题)的开放域多轮对话规划

2020 年 5 月 20 日 深度学习自然语言处理

论文名称:Knowledge Graph Grounded Goal Planning for Open-Domain Conversation Generation
论文作者:徐俊,王海峰,牛正雨,吴华,车万翔
原创作者:哈工大 SCIR 博士生 徐俊
下载链接:AAAI2020通讯
转载须注明出处:哈工大SCIR

1 简介

经典的基于神经网络的开放域对话生成没有有效的机制来管理聊天主题,并且往往产生不太连贯的多轮对话。在人-人对话策略的启发下,我们将多轮开放域对话生成任务分为两个子任务:显式目标(话题)序列规划和目标细化(深入话题聊天)。为此,我们提出了一个基于知识的三层强化学习模型(KnowHRL)。具体来说,对于第一个子任务,上层策略学习遍历知识图(KG),以规划显式目标序列,从而在对话一致性、主题一致性与用户兴趣之间取得良好平衡。对于第二个子任务,中间层策略和下层策略协同工作,借助目标完成机制,围绕给定话题的同用户进行深入聊天。显式目标序列规划功能使开放域聊天机器人具备主动引导对话能力,具有许多实际应用场景,如推荐学习资源。实验表明,我们的模型在用户兴趣一致性、对话一致性和知识准确性方面优于最新的基线。

2 方法

术语解释:本文中,受限于资源,我们将对话目标设定为围绕特定话题聊天。为了描述的方便,后续将使用“聊天话题”一词代替“聊天目标”。值得注意的是,本文所提框架支持多种对话目标,包含任务完成、对话推荐等。我们定义话题为知识图谱中的节点,进一步地,为围绕话题深入聊天,我们定义话题可聊侧面为知识图谱中关于该话题的的三元组。如下图中,节点《麦兜·饭宝奇兵》是一个话题,而该话题的一个聊天侧面可能是【《麦兜·饭宝奇兵》,主演,彭博】,表明该话题可以深入聊它的导演。

图1 话题与话题可聊侧面示例图

我们首次提出将开放域对话任务分为对话话题规划和围绕话题深入聊天两个子任务,下面的示意图显示了这个过程。浅红色大圆圈代表聊天话题,里面的蓝色节点和边代表了围绕该话题的深入聊天。系统跟用户聊完一个话题再聊下一个话题。

图2 基于话题规划和深入话题聊天的对话过程示意图

进一步地,我们提出基于知识图谱的三层层次化强化学习模型(KnowHRL)。其中,上层负责学习在知识图谱上规划话题序列;中、下层协同完成围绕话题的深入聊天。具体而言,中层在选定话题节点的邻居中选择一个可聊侧面;下层负责基于给定话题和话题可聊侧面同用户进行多轮对话。

图3 基于知识图谱的三层层次化强化学习模型(KnowHRL)

通过两个子任务的划分,以及三层的策略模型,KnowHRL在对话过程中获得可解释的离散对话状态,模型得以主动规划对话内容,进而提升连贯性。

为了训练KnowHRL,我们设计了多种来源的奖励信号:

  • 上层奖励
    • 对话话题序列连贯度:TransE[1]空间的平均cosine距离
    • 用户兴趣一致性:用户提及新话题时候,bot应该相应调整
    • 多样性: 在频繁切换对话话题和一直停留在一个对话话题间取得平衡
    • 可持续性:鼓励bot聊内容丰富的节点,使用PageRank打分
    • 来自中层的对话话题完成情况
  • 中层奖励
    • 可聊内容侧面之间的连贯度以及来自下层的奖励情况
  • 下层奖励
    • 句间相关度
    • 生成语句丰富度
    • 是否完成给定的可聊内容侧面

3 实验设置

我们在百度公开发布的知识对话数据集DuConv[2]上进行实验,该数据集提供人工标注的约3万个对话,共含有约12万句子;同时,数据集提供电影明星领域的知识图谱,含有约9.1万电影,5.1万明星以及360万三元组。

我们对比了SOTA知识增强的对话生成模型CCM[3]以及SOTA的基于隐变量的强化学习对话模型LaRL[4]。此外,为了验证所提奖励的有效性,我们设置对照组KnowHRL-liteReward,只使用常见的句间相关度和生成语句丰富度作为奖励信号。

所有模型在测试和训练(如果需要)阶段使用同一个用户模拟器,MMPMS模型[5]。

为了综合评估模型的效果,我们在多轮和单轮两个层面从以下几个维度分别进行评估:

  • 多轮评估指标
    • 连贯度:话题内连贯度 (Intra.),话题间连贯度 (Inter.)
    • 多样性(Dist-2)
    • 知识正确性 (K.A.)
    • 用户兴趣一致性 (Cons.)
  • 单轮评估指标
    • 适合度 (Appr.),信息丰富度 (Info.)

4. 实验结果

  1. 多轮对话评估
图4 多轮对话评估结果
  1. 单轮对话评估
图5 单轮对话评估结果

5 对话样例

图6 人机对话样例

上图给出了一段人机对话样例(使用中文对话,翻译成英文)。在对话中,模型一共同人聊了三个话题(标红的实体)。

参考文献

[1]. Bordes, A.; Usunier, N.; Garcia-Duran, A.; Weston, J.; and Yakhnenko, O. 2013. Translating embeddings for modeling multi-relational data. In NIPS, 2787–2795.

[2]. Wu, W.; Guo, Z.; Zhou, X.; Wu, H.; Zhang, X.; Lian, R.; and Wang, H. 2019. Proactive human-machine conversation with explicit conversation goals. In Proceedings of ACL.

[3]. Zhou, H.; Young, T.; Huang, M.; Zhao, H.; Xu, J.; and Zhu, X. 2018. Commonsense knowledge aware conversation generation with graph attention. In Proceedings of IJCAI-ECAI.

[4]. Zhao, T.; Xie, K.; and Eskenazi, M. 2019. Rethinking action spaces for reinforcement learning in end-to-end dialog agents with latent variable models. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), 1208-1218.

[5]. Chen, C.; Peng, J.; Wang, F.; Xu, J.; and Wu, H. 2019. Generating multiple diverse responses with multi-mapping and posterior mapping selection. Proceedings of IJCAI.


本期责任编辑:张伟男

本期编辑:王若珂


投稿或交流学习,备注: 昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多: 机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等
记得备注呦


登录查看更多
6

相关内容

开放域是只有部分边界被定义或者其边界超出数据空间的几何区域,开放区域一般针对几何图形的边界不重要或者是无限的情况,例如,开放的直线、开放的平面和开放的空间,把这些开放形状描述为抽象的类。
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
专知会员服务
85+阅读 · 2020年1月20日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
基于RASA的task-orient对话系统解析(一)
AINLP
16+阅读 · 2019年8月27日
技术动态 | ACL 2019 知识图谱的全方位总结
开放知识图谱
4+阅读 · 2019年8月14日
哈工大SCIR两篇论文被IJCAI 2019录用
哈工大SCIR
7+阅读 · 2019年5月11日
论文浅尝 | 基于图注意力的常识对话生成
开放知识图谱
8+阅读 · 2019年2月5日
知识在检索式对话系统的应用
微信AI
32+阅读 · 2018年9月20日
一文读懂智能对话系统
数据派THU
16+阅读 · 2018年1月27日
刘挺 张伟男 | 人机对话
中国计算机学会
7+阅读 · 2017年9月19日
KBQA: 基于开放域知识库上的QA系统 | 每周一起读
Arxiv
14+阅读 · 2020年1月27日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Arxiv
6+阅读 · 2018年11月1日
Arxiv
26+阅读 · 2018年9月21日
VIP会员
相关VIP内容
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
专知会员服务
85+阅读 · 2020年1月20日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
相关资讯
基于RASA的task-orient对话系统解析(一)
AINLP
16+阅读 · 2019年8月27日
技术动态 | ACL 2019 知识图谱的全方位总结
开放知识图谱
4+阅读 · 2019年8月14日
哈工大SCIR两篇论文被IJCAI 2019录用
哈工大SCIR
7+阅读 · 2019年5月11日
论文浅尝 | 基于图注意力的常识对话生成
开放知识图谱
8+阅读 · 2019年2月5日
知识在检索式对话系统的应用
微信AI
32+阅读 · 2018年9月20日
一文读懂智能对话系统
数据派THU
16+阅读 · 2018年1月27日
刘挺 张伟男 | 人机对话
中国计算机学会
7+阅读 · 2017年9月19日
KBQA: 基于开放域知识库上的QA系统 | 每周一起读
Top
微信扫码咨询专知VIP会员