卖得了萌,耍得了宝,有了聊天机器人还要什么对象 | DeeCamp Show

2018 年 8 月 25 日 创新工场

水果只买3、4个,快递全部寄公司,下班只能面对空荡荡的房间...独在异乡、独自租房、长期独身。


你,中招了吗?


有数据显示:目前在中国,有超过5800万人过着“一个人的生活”,其中20岁~39岁的独居青年已达到2000万。


享受不到亲情,没有老友,缺乏关心,每一个繁华都市里的孤独者都曾体会过饱受孤独煎熬,被失落折磨的滋味。


而这样冷清的空巢生活,亟需丰富的情感满足与专属的陪伴安慰。


谁不想要一个能“随叫随到,时刻陪伴”的小话唠呢?


你看,这有一只蠢萌可爱的Aloha已经坐好,时刻准备接受“调戏”。



聊天机器人是最近比较火的研究方向与应用。各大巨头都投入了巨大的资源进行技术与产品研发。目前的聊天机器人技术通常聚焦在开放域聊天和面向特定任务的对话。


如何开发出一款能够以给定语言风格的对话机器人,让聊天机器人具有特定的调性、人格,将是一项极具挑战且十分有趣的任务。


陪聊机器人Aloha演示视频:


而勇敢的接受了这项挑战并将其超预期完成的是DeeCamp第14组的成员们




在5周内,他们利用检索、生成等不同的AI技术, 极其高效地实现了一个一流聊天机器人必备的几乎所有核心技术环节,训练出了一个基于微信的专职闲聊机器人--Aloha。


Aloha属性可爱。卖得了萌,耍得了宝,时而是贴心大暖男,时而变身逗比段子手。


不仅能回复文字消息,斗图也不在话下。从和它的互动中,你完全察觉不到,陪你聊天的其实是一个AI。


最关键的是,Aloha为陪伴而生,永远在线,绝不让你孤单。


一、技术揭秘


为了能使Aloha拥有像人一样有趣的灵魂,第14组的成员们可没有少费心。


1.海量语料支撑,有趣度赶超人类


第14组的成员们从知乎、新浪微博、豆瓣和小黄鸡上收集了一千多万条语料,并对这些语料进行了处理,清除掉对训练有害的异常语料并构建高频词表。可以说,拥有如此丰富语料支撑的Aloha不仅能理解我们常用的网络用语,甚至还能有趣胜过人类哦。




2.斗图模式开启,还原真实聊天场景


通过运用基于规则、基于检索(以及对检索得到的回复进行编辑生成回复)、基于生成(seq2seq、DPGAN)三种方法、四种模型来形成聊天回复语句。并结合当下的聊天习惯,增加了斗图版块,如果你向Aloha连续发送三张表情包,它就可以与你愉快地开启斗图大战。



3.表情包不够?Aloha来凑!


除了陪聊,Aloha还是表情包匹配高手哦。


平时在聊天时,我们可能会苦恼自己的表情包匮乏,跟不上队友的节奏。


而Aloha可以根据文字匹配表情包。你可以发送“表情包:文字内容”,Aloha就会给你发送一个对应内容的表情包。


比如当你发送“表情包:666”给Aloha,它会立马为你贡献一张好玩的表情包。


二、Aloha的背后高手




功夫不负有心人,经过了激烈的角逐,第14组最终抱回了DeeCamp2018最佳技术奖。


DeeCamp的总时长是5周,但留给每个小组做项目的时间只要不到3周。对于这群AI经验并不丰富的大学生来说,这意味着极强的学习压力与极大的工作量。


因此第14组在最开始便规划好了每个人需要做的模块,并分小队确定了分工。在项目进展过程中,时刻保持交流探讨,定期汇报各自的进展。


每个人都有条不紊地完成着自己的任务,在配合中不断尝试着改进,用彼此的默契和不懈的努力打造了史上最可爱的聊天机器人--Aloha


来看看测试期Aloha与真人的聊天记录吧~





在这段DeeCamp之旅中,第14组的成员收获的不仅是一份作品,一个奖杯,还有这一个月来与队友朝夕相处的友情。


有一位第14组的神秘队友透露:他们的第一次聚餐是在农园食堂三楼。初次见面的他们带着拘谨,试探性地问着对方的名字和知识了解程度,像标识数据一样在脑海里用“男/女”、“博士/硕士/本科”、“xx大学”这样呆板的标签标记对彼此的印象。



而5周后,团队里的每个人有多少条猫猫狗狗,爱听什么歌,喜欢吃什么,笑起来、生气起来是什么样的,他们一个不剩的全都知道了。就像一个温馨的小家庭一样在学习的路上互帮互助,互促互进。 


我们可能都希望能生活在这样的世界里:和机器人有着最自然的对话,它将一切任务都执行得完美无瑕。


但或许,最美妙的互动还是发生在人与人之间。


能卖萌、耍宝、陪聊的机器人固然可爱,但除此之外我们还有能填词、会谱曲、会画画、懂艺术.....的AI技术,这些都是DeeCamp学生做的有趣项目,未来几天还会陆续分享给大家,敬请期待哟~

推荐阅读:

欢迎关注创新工场微信公众号:chuangxin2009。创新工场拥有强大的投资和投后团队,持续输出关于创业投资、投后的真知灼见~ 还有机会参与到创业培训、沙龙和其他各类活动中。


登录查看更多
0

相关内容

Chatbot,聊天机器人。 chatbot是场交互革命,也是一个多技术融合的平台。上图给出了构建一个chatbot需要具备的组件,简单地说chatbot = NLU(Natural Language Understanding) + NLG(Natural Language Generation)。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【中科院信工所】视听觉深度伪造检测技术研究综述
专知会员服务
40+阅读 · 2020年4月15日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
160+阅读 · 2019年10月28日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
面向对象:等你来撩
前端大全
5+阅读 · 2019年7月26日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
拔刺 | 如何通过人工神经网络实现图像识别?
当我们在读书时,我们在读什么?
互联网er的早读课
3+阅读 · 2018年3月19日
为什么聊天机器人表现不尽如人意
AI前线
5+阅读 · 2018年1月28日
【NLP】周明:自然语言对话引擎
产业智能官
6+阅读 · 2017年10月19日
谈谈王者荣耀
小道消息
4+阅读 · 2017年7月6日
Arxiv
3+阅读 · 2018年3月14日
VIP会员
相关资讯
面向对象:等你来撩
前端大全
5+阅读 · 2019年7月26日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
拔刺 | 如何通过人工神经网络实现图像识别?
当我们在读书时,我们在读什么?
互联网er的早读课
3+阅读 · 2018年3月19日
为什么聊天机器人表现不尽如人意
AI前线
5+阅读 · 2018年1月28日
【NLP】周明:自然语言对话引擎
产业智能官
6+阅读 · 2017年10月19日
谈谈王者荣耀
小道消息
4+阅读 · 2017年7月6日
Top
微信扫码咨询专知VIP会员