视觉对话 - 专知主题

视觉对话主要任务为：AI代理与人类以自然的会话语言对视觉内容进行有意义的对话。具体而言，给定图像，对话历史和关于图像的问题，代理必须将问题置于图像中，从历史推断上下文，并准确的回答问题。视觉对话具有访问和理解的多轮对话历史，所以需要一个可以组合多个信息源的编码器。

专知会员服务

14+阅读 · 2022年5月4日

专知会员服务

18+阅读 · 2020年10月11日

专知会员服务

22+阅读 · 2020年8月12日

专知会员服务

18+阅读 · 2019年6月17日

参考链接

微信扫码咨询专知VIP会员