论文摘要: 我们提出了一个大型的可调神经会话响应生成模型DIALOGPT(对话生成预训练Transformer)。经过2005年至2017年期间从Reddit评论中提取147M大小的类似的对话内容,DialoGPT扩展了Hugging Face PyTorch transformer,在单轮对话设置中实现了在自动和人类评估性方面都接近人类。我们表明,利用DialoGPT的会话系统比基线系统生成更相关、更有内容和上下文一致的响应。预训练的模型和训练方法已经公开发布,以促进对神经响应生成的研究和更智能的open-domain对话系统的开发。

代码链接https://github.com/microsoft/DialoGPT

3+
0+

相关内容

摘要: 我们提出了EMU,一个从语义上增强多语言句子嵌入系统。我们的框架使用两个主要组件(语义分类器和语言鉴别器)对预先训练好的多语言句子嵌入进行了微调。语义分类器提高了相关句子的语义相似度,而语言鉴别器通过多语言对抗训练增强了嵌入语的多语言性。我们的实验结果基于几个语言对表明,我们的专门嵌入优于最先进的多语言句子嵌入模型的任务,跨语言意图分类仅使用单语标记的数据。

8+
0+

【深度学习视频分析/多模态学习资源大列表】'Awesome Deep Learning for Video Analysis - Papers, code and datasets about deep learning for video analysis, multi-modal learning' by Huaizheng GitHub ​​​​

13+
0+
Top