开始报名!SMP机器人群聊比赛

2019 年 6 月 28 日 哈工大SCIR

声明:本文转载自公众号 社媒派SMP。

欢迎

欢迎来到SMP机器人群聊比赛(SMP Multi-bot Conversation Challenge, )。


人机对话技术是人工智能领域的一个重要研究方向,从手机智能助手,到闲聊陪护型聊天机器人,再到各种面向场景的任务型对话系统平台和智能家居,人机对话系统渐渐融入人类社会的日常运行中,促进了将来人机共融社会的发展。然而,目前的人机对话仅限于人机双方的对话模式,而更具挑战的人机多方混合对话乃至机器人多方群聊的任务在研究和应用上鲜有涉及。


SMP机器人群聊比赛()由国中文信息学会社会媒体处理专委会社交机器人工作组主办,天津大学新媒体与传播学院承办。本次比赛旨在促进人机对话技术在多方对话场景上的发展,充分挖掘人机对话技术在各种应用场景下的潜力,为人机对话技术相关的学术界研究人员和产业界从业人员提供一个良好的沟通平台。在此,我们诚邀各个单位参加SMP机器人群聊比赛()!

评测任务

任务描述


在机器人群聊场景中,已知群聊主题和历史消息记录,要求生成符合群聊主题和上下文逻辑的回复。所生成的回复需要流畅且与群聊对话主题相关。


任务说明

  • 群聊主题
    在任务中,我们会给定群聊主题,在每个主题下进行
    轮对话(N表示参与群聊机器人总数)。其中,主题包括但不限于医疗、交通、教育、金融等。

  • 轮转策略
    在某个群聊主题下,我们将按一定策略初始化机器人回复顺序,确保所有机器人的回复优先级总体相同。而在其他群聊主题中,我们将多次轮番调换机器人回复顺序,以保证最终评分环境的公平性。

  • 消息决策
    在评测任务中,当我们向每个机器人请求回复时,会提供当前群聊主题和历史消息记录。参赛队伍需要根据群聊主题和历史消息记录进行相关决策,以生成合理的回复。

评测形式

接口设定


参赛队伍需要提供聊天机器人的接口API,我们将使用该接口API进行群聊评测。需要注意的是,接口API的阻塞时间为10s。若超时未回复,则标记回复失败,多次回复失败将影响最终评测得分。


接口API的交互数据格式如下:

 1# 数据编码格式均为UTF-8
2
3# 输入消息数据格式
4data = {
5    # 当前群聊id
6    "group_id": group_id,
7    # 当前群聊主题
8    "topic": topic,
9    # 自该机器人上次回复之后的消息记录(按时间先后顺序)
10    "msgs":[
11        {
12            "from_id": robot_id,
13            "msg": msg
14        },
15        ...
16    ]
17}
18
19# 回复消息数据格式
20resp = {
21    # 当前群聊id
22    "group_id": group_id,
23    # 回复机器人id
24    "from_id": robot_id,
25    # 回复消息
26    "msg": msg
27}


训练数据


参赛队伍可以使用包括但不限于医疗、交通、教育、金融等主题的多方对话数据进行模型训练。

评价指标

自动评价

初赛阶段采用自动评价指标,参赛队伍需提交自己的聊天机器人接口API。机器人在群聊中的性能表现将会作为排名依据。

自动评测所使用的指标包括:

  • Topic:评估输出回复和群聊主题的相关程度。

  • Perplexity:评估输出回复的流畅性。

  • Distinct:评估输出回复的多样性。

  • BLEU:评估输出回复相对于参考回复的N-gram重合度。

部分指标说明:

  • Topic:设生成回复, 群聊主题,主题分类模型,则有用于计算回复的主题相关程度。

  • BLEU:设输入消息集合, 我们将使用相关技术手段获得的参考回复集合,然后计算的N-gram重合度。

我们将综合考虑四个指标来进行初赛排名。

人工评价

决赛阶段,我们将选取初赛排名靠前的聊天机器人进行人工评估,使用众包的方式对群聊中每个机器人的回复在如下三个方面进行评价:

  • Topic:生成的回复是否符合当前群聊主题(考虑主题)。

  • Fluency:生成回复的表达是否流畅,无语法错误(考虑句子)。

  • Appropriateness:生成的回复是否符合人们的日常交流习惯(考虑上下文语境)。

其中,在每个指标上至少有5个人进行评价,每个指标评分取值集合为,0表示差,1表示一般,2表示好。

决赛排名将以人工评估结果为依据。

注:此次比赛中我们将采取匿名评测,即对外只公布参赛队伍的代号和评测成绩,不公布参赛队伍的具体信息。

注册报名

有意向参加的单位机构请直接填写在线报名表(可点击原文链接,也可扫描下方二维码)。 

报名存在任何问题,请联系评测会务组:smp_mcc@163.com

重要日期

以下所有时间点为北京时间(GMT+8)11:59 PM。

时间 任务 形式
2019年6月28日-2019年8月28日 报名 在线
2019年8月31日 发布群聊主题 在线
2019年9月1日-2019年11月15日 参赛队伍系统开发 codalab在线
2019年10月15日 预评测(开发集) codalab在线
2019年11月16日 正式评测(初赛) codalab在线+直播
2019年11月17日-2019年11月31日 人工评测(复赛) 人工标注评测
2019年12月14日 召开论坛 参赛队伍技术报告+主题报告

组织委员会

组织委员会: 张洪忠(北京师范大学)、黄民烈(清华大学)、张伟男(哈尔滨工业大学)、王赞(天津大学)

联系方式

如果有任何与本次评测相关的问题,请随时联系会务组。 

评测会务组邮箱:smp_mcc@163.com

致谢

主办方:中国中文信息学会社会媒体处理专委会社交机器人工作组

承办方:天津大学新媒体与传播学院

天津大学新媒体与传播学院(新传学院)成立于2019年,学院依托天津大学的学术资源,联合优质社会力量,探索新文科与新工科交叉的建设模式,以贯通“理工文管”为理念,坚持技术驱动和学科交叉,找准大数据及人工智能等技术与新闻传播学科的结合点,高起点建设“中国特色、世界一流、天大品格”的新媒体交叉学科平台。


截至目前,学院共聘任专兼职教师25人,在自然语言处理、文本挖掘、社会化媒体与政治传播等领域开展交叉学科研究。新媒体研究院作为学院的内设机构,首批研究生已入校,并已完成2019级硕士研究生招生复试工作。学院在学校新老校区均具有独立办学空间,并建有融媒体大数据分析平台。


未来,新传学院将继续引进新闻传播与计算领域高端学者,培养本、硕、博复合型新闻传播人才,贡献高水平的新媒体研究成果和智库服务,努力建成智能时代下的新媒体与传播学院。

本期责任编辑:崔一鸣

本期编辑:刘元兴




“哈工大SCIR”公众号

主编:车万翔

副主编: 张伟男,丁效

责任编辑: 张伟男,丁效,刘一佳,崔一鸣

编辑: 李家琦,吴洋,刘元兴,蔡碧波,孙卓,赖勇魁


长按下图并点击 “识别图中二维码”,即可关注哈尔滨工业大学社会计算与信息检索研究中心微信公共号:”哈工大SCIR” 。

登录查看更多
13

相关内容

社会媒体处理(Social Media Processing, SMP)是从社会媒体数据中挖掘、分析和表示有价值信息的过程。 简单来讲,社会媒体处理研究的目标就是通过挖掘社会媒体中用户生成内容和社交关系网络,来衡量用户之间的相互作用,进而发现这其中蕴含的特定模式来更好地理解人类行为特点。
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
SMP 2019 第三届中文人机对话技术评测顺利落幕
哈工大SCIR
12+阅读 · 2019年8月19日
SMP2019中文人机对话技术评测(ECDT)报名开始啦
哈工大SCIR
15+阅读 · 2019年4月17日
SMP2018中文人机对话技术评测
哈工大SCIR
12+阅读 · 2019年3月6日
2019语言与智能技术竞赛报名开启
中国计算机学会
16+阅读 · 2019年2月26日
ADL报名 | 从自然语言理解到问答机器人
中国计算机学会
5+阅读 · 2017年10月17日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
7+阅读 · 2019年4月8日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
3+阅读 · 2018年3月5日
VIP会员
相关VIP内容
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
Top
微信扫码咨询专知VIP会员