图2. 用于SIENNA的技术途径和方法的高级表示。

本报告详细介绍了一种使用聊天机器人技术与对话者接触的新方法,同时通过使用软件代理中实现的独特虚拟角色积极征求信息。这项研究名为 "调查和获取攻击者信息的策略"(SIENNA),是在国防高级研究计划管理局(DARPA)主动社会工程防御(ASED)项目的技术领域(TA)2下进行的。

我们研究的产品包括两个主要技术:

  • SIENNA-Bot:一个旨在使用特定领域内容与对话者交谈的聊天机器人。
  • Cervantes: 一个用于特定领域对话开发的图形用户界面(GUI),它围绕着任务的概念发展,即一系列复杂度不断增加的问题,旨在从对话者那里获得信息。

TA2成功的关键是产生符合逻辑和连贯的对话。这种对话应能有效地吸引对话者并与之互动,就像他们与另一个人交流一样。为了生成内容,我们采用了一种新颖的自然语言生成作者方案,该方案由属性语法驱动。SIENNA-Bot遵循的是一种管道设计方法:

  • 自然语言理解(NLU)。确定传入信息的意图并分配属性。
  • 对话生成。确定的内容属性与对话状态进行评估,以确定下一步行动。
  • 自然语言生成(NLG)。生成对信息的可行的回应。

在投入时间设计和开发语言理解和生成组件之前,为了证明这种设计的有效性,我们开发了一个带有简单对话生成器的初步概念验证聊天机器人。这个机器人的目标是确认通过简单的话语技术使对话者参与对话的功效,而不需要开发必要的组件来解析和理解信息内容。由此产生的机器人能够通过扮演两个不同的角色之一来反击冒名顶替的攻击:

  • 有需求的自恋者。喜欢八卦同事和目标领域的同事,对最近同事的成功表示厌恶,喜欢讲关于自己的漫无边际的故事。
  • 唾弃的同事。利用叙事的隐蔽性,介绍虚构的背景故事作为谈话的手段。因为对话者只是假装认识这个对象:
    • 一个虚构的故事让机器人迅速控制了对话
    • 不需要理解信息的内容

在这个基础机器人的基础上,我们接下来研究了通过纳入NLU和NLG将现实主义引入对话的技术。SIENNA中的NLU模块的目标是:

  • 理解对话者所说的语用学内容
  • 从对话者的信息中提取关键信息片段

这一目标是通过使用预先训练好的Transformer模型来实现的,该模型增加了理解对话者信息的语用学的层次,同时提取关键的信息,称为标志。由此产生的NLU能够对各种类型的话语行为进行分类,其主要优势在于提供:

  • 对话状态信息
  • 为内容编写提供便利条件

例如,通过检测对话者在回答任务时的争论,SIENNA可以利用这一信息来改变任务的方向,或者分配一个新的、可能更容易的任务。信任跟踪的概念也被纳入SIENNA的NLU中,其指导原则是::

  • 困难的请求需要高水平的信任
  • 当任务完成后,信任度会上升

从这些公理出发,我们设计了NLU功能,将任务的成功完成与每个信息内容的确定合规性相结合。如果一个任务没有完成,或者NLU模块在信息中检测到愤怒、沮丧或不耐烦等情绪,那么整体的信任度就会下降。相反,如果对话者顺从并愿意回答问题,信任程度就会上升。

我们通过纳入两种技术进一步发展了对话生成功能:

  • 对话状态。保持并使用先前的对话内容,如
    • 前提条件,确定是否应该使用对话内容。
    • 建立和保持未来持续对话状态的效果
  • 定制对话生成器。这些对话生成器提供专门的内容生成,旨在处理对话的具体细节

这项工作产生了一个NLG模块,它能够通过与对话者争吵、争论和对一件小事提出异议的过程,根据输入信息的语义产生对话。

随着这些新技术的加入,SIENNA机器人纳入的对话理解和一致性水平远远超出了项目开始时计划的最初 "哑巴 "机器人战略。

SIENNA采取的程序性内容生成方法需要有创造对话领域的能力。具体来说,要有让非开发人员和非SIENNA专家构建新任务的功能。SIENNA使用一种策略,向对话者提出越来越复杂的问题,以消耗对话者的时间,同时从他们那里获得信息。这些问题被称为任务。为了使内容创作者能够为一个领域编写一系列的任务,我们开发了一个用户友好的编辑器,叫做Cervantes。

创建Cervantes编辑器的第一步是设计和开发一种特定领域的语言(DSL)。通过使用DSL,我们建立了一个正式的结构,促进了对Cervantes设计的快速迭代。DSL的语义包括:

  • 定义区块。这些块设置了可重复使用的动作、反应和行为,贯穿整个任务集。
  • 任务块。一个特定的 "任务",机器人试图让对话者在执行时浪费时间和/或透露信息。
  • 条件和效果。为作者提供连接一系列任务的能力,并允许SIENNA任务管理器随着对话的发展在任务之间动态过渡。

由此产生的Cervantes的功能集包括:

  • 详细的任务编辑器: 能够创建令牌、变量和对话的能力
  • 嵌入式帮助: 用户界面(UI)有一个超链接的嵌入式帮助系统
  • 任务模拟器: 一个模拟器,用于在开发期间测试和调试任务
  • 多用户界面: 支持多用户的功能
  • 权利和角色: 权利和角色:以常见的开源平台为模型,如GitHub,其中用户是项目的成员,每个项目都有特定的权利和角色
  • 版本管理: 在用户界面中创建项目版本的能力。

在该项目过程中,我们开发了一个由50个任务组成的任务库。此外,我们将塞万提斯部署在一个共享服务器上,所有表演者都可以访问,有多个非雷神BBN技术公司(BBN)的合作者团队创建了任务库,如科罗纳病毒病(COVID)任务库和法院传票库。

总之,SIENNA使用富有表现力的聊天机器人与对话者接触的方法表现出了有效和验证的结果。在该项目过程中,SIENNA捕捉到的真正的正面标志的数量从71%增加到89%。多个非SIENNA团队组织成功地使用塞万提斯创建了他们自己的特定领域追求库。

我们对SIENNA的进一步发展的主要建议是:

  • 多语言支持。
  • 人在回路中。
  • 团体机器人互动。
  • 在可用时利用外部信息。
  • 改进跨平台切换。
成为VIP会员查看完整内容
28

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《机器人语言》美陆军5年项目46页技术总结报告,2023年
专知会员服务
37+阅读 · 2023年5月17日
美军条令 | 《空军作战信息》2023年
专知会员服务
91+阅读 · 2023年2月12日
【美陆军作战条令】《美国陆军防空与导弹防御行动》156页
《反叛能力、情报收集和作战策略》2022最新60页报告
专知会员服务
31+阅读 · 2022年10月29日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
23+阅读 · 2021年10月11日
Arxiv
14+阅读 · 2020年9月1日
已删除
Arxiv
31+阅读 · 2020年3月23日
VIP会员
相关基金
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员