AI 竞赛 | 2018 机器阅读理解技术竞赛

2018 年 3 月 16 日 AI研习社

机器阅读理解 (Machine Reading Comprehension) 是指让机器阅读文本,然后回答和阅读内容相关的问题。阅读理解是自然语言处理和人工智能领域的重要前沿课题,对于提升机器智能水平、使机器具有持续知识获取能力具有重要价值,近年来受到学术界和工业界的广泛关注。

为了促进阅读理解技术发展,中国中文信息学会、中国计算机学会和百度公司联手举办 “2018 机器阅读理解技术竞赛”。竞赛将提供面向真实应用场景的大规模中文阅读理解数据集, 旨在为研究者提供学术交流平台,进一步提升阅读理解的研究水平, 推动语言理解和人工智能领域技术和应用的发展。竞赛将在第三届 "语言与智能高峰论坛"举办技术交流和颁奖。诚邀学术界和工业界的研究者和开发者参加本次竞赛!

  竞赛详情

1. 竞赛任务

对于给定问题q及其对应的文本形式的候选文档集合D=d1, d2, ..., dn,要求参评阅读理解系统自动对问题及候选文档进行分析, 输出能够满足问题的文本答案 a。目标是 a 能够正确、完整、简洁地回答问题q

2. 数据简介

本次竞赛数据集来自搜索引擎真实应用场景,其中的问题为百度搜索用户的真实问题,每个问题对应 5 个候选文档文本及人工整理的优质答案。

数据集共包含 30 万问题,包括 27 万的训练集,1 万开发集和 2 万测试集。其中 20 万数据已在DuReader(https://arxiv.org/abs/1711.05073 )发布,包括 18 万训练集、1 万的开发集和 1 万的测试集。这部分数据可自由下载(http://suo.im/4oKKPA ),供参赛者训练和测试使用。报名截止后,新增的 10 万数据集也将在数据下载区发布。

3. 评价方法

竞赛基于测试集的人工标注答案,采用ROUGH-L(http://suo.im/HWmPz )和BLEU4(http://suo.im/KFx9D )作为评价指标,以ROUGH-L(http://suo.im/HWmPz )为主评价指标。针对是非及实体类型问题,对 ROUGE-L 和 BLEU4 评价指标进行了微调, 适当增加了正确识别是非答案类型及匹配实体的得分奖励, 一定程度上弥补传统 ROUGE-L 和 BLEU4 指标对是非和实体类型问题评价不敏感的问题。

* 详细的评价指标说明参见数据集中包含的 “评测细则 “文档。

4. 基线系统

竞赛将提供两个开源的阅读理解基线系统,基线系统的实现及结果评价请参考:开源系统(http://suo.im/4oKKPA )和数据集论文(https://arxiv.org/abs/1711.05073 )。

  参赛方式

1. 参赛对象

本次技术竞赛面向全社会开放,相关领域的个人、科研机构、高等院校、企业单位等人员均可报名参加。

2. 报名方式

竞赛网站将于 2018 年 3 月 1 日开放注册报名,请及时关注。

登录机器阅读理解技术竞赛官网(http://mrc2018.cipsc.org.cn/ ),完善相关信息,即可报名参赛。

* 正式报名并最终提交有效结果的团队, 每位成员均可获得一件大赛定制纪念 T 恤。

3. 报名时间

2018 年 3 月 1 日至 2018 年 3 月 31 日

  奖项设置

竞赛将评出一等奖 1 名,二等奖 2 名,三等奖 3 名。由主办方中国中文信息学会(CIPS)和中国计算机学会(CCF)为获奖者提供荣誉证书认证;由百度公司为获奖者提供奖励和参会交流赞助。

* 注:

1. 以上所有提及金额均为税前金额。

2. 获奖评定需选手提供系统报告(包括方法说明、系统代码和数据、参考文献和引用开源工具等)及团队成员名单。

  组织单位

1. 主办方

中国中文信息学会  中国计算机学会

2. 承办方

百度公司  中国中文信息学会评测工委会  中国计算机学会中文信息技术专委会

3. 指导委员会

孙乐  中国科学院软件技术研究所

周明  微软亚洲研究院

杨尔弘  北京语言大学

4. 评测委员会

吕雅娟  百度公司

韩先培  中国科学院软件研究所

万小军  北京大学

限时拼团

3 大模块,30 个课时

高校数学系教授带班

100% 学员好评

与 100 + 同学一起夯实数学基础,走稳机器学习入门第一步!

▼▼▼






新人福利



关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据,教程,论文】



Github 项目推荐 | 可提取结构化信息的自然语言理解 Python 库 Snips NLU

登录查看更多
7

相关内容

包括微软、CMU、Stanford在内的顶级人工智能专家和学者们正在研究更复杂的任务:让机器像人类一样阅读文本,进而根据对该文本的理解来回答问题。这种阅读理解就像是让计算机来做我们高考英语的阅读理解题。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
人机对抗智能技术
专知会员服务
187+阅读 · 2020年5月3日
专知会员服务
197+阅读 · 2020年3月6日
NLP基础任务:文本分类近年发展汇总,68页超详细解析
专知会员服务
73+阅读 · 2019年10月19日
2019语言与智能技术竞赛报名开启
中国计算机学会
16+阅读 · 2019年2月26日
DuReader:百度大规模的中文机器阅读理解数据集
全球人工智能
7+阅读 · 2018年5月8日
Arxiv
3+阅读 · 2019年9月5日
Symbolic Priors for RNN-based Semantic Parsing
Arxiv
3+阅读 · 2018年9月20日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
QuAC : Question Answering in Context
Arxiv
4+阅读 · 2018年8月21日
Arxiv
4+阅读 · 2018年5月14日
VIP会员
Top
微信扫码咨询专知VIP会员