开发能够与其他智能体互动以完成特定任务的自主智能体是人工智能和机器学习的一个核心研究领域。为了实现这一目标,自主智能体研究小组为自主系统控制开发了新的机器学习算法,具体重点是深度强化学习和多智能体强化学习。研究问题包括协调智能体策略和智能体间通信的可扩展学习;从有限的观察中推理其他智能体的行为、目标和构成;以及基于内在动机、课程学习、因果推理和表征学习的样本效率学习。本文对该小组正在进行的研究组合进行了广泛的概述,并讨论了未来方向的开放问题。