大赛 | 「中国法研杯」司法人工智能挑战赛,打造专属的AI律师

2018 年 5 月 9 日 AI科技评论

打造专属的 AI 律师,你准备好了吗?

在数字信息化的今天,人工智能的发展日益成熟,而随着司法大数据的采集和积累,AI(Artificial Intelligence)技术有望在短时间内处理大量文书、快速给出新案件的罪名、刑期及适用法条的推荐等任务中大显身手。AI 技术不仅能提高法院等机构的办事效率,还能让公民根据案情快速了解可能面临的处罚,真正做到国家司法的公正性和高效能性。

为了实现法院审判体系和审判能力智能化,使得人工智能技术在「案例分析、法律文件阅读与分析」等问题中更有力的发挥其作用,我们将公布世界上最大的裁判文书标准数据集,并希望通过组织本次比赛活动,与相关研究人员一起探索数据的可能性,积累具有智能审判能力的算法和模型,做出技术突破,为该领域的科学研究添砖加瓦。

或许你是一位胸怀抱负的科研人员,却因繁缛又不具挑战性的项目困在实验室,无法全力施展自己的能力;或许你是一位 AI 领域的大牛,却暂时没能找到最适合自己的课题;或许你是一位刚刚入门的新手,正苦于不知如何提升自己;也或许你怀抱着一颗爱国之心,想为祖国的法律事业携去一缕清风。

为此,我们在最高人民法院、中国中文信息学会、共青团中央青年发展部的共同指导下组织本次司法人工智能挑战赛,我们将公布百万量级的文本文件,诚邀对司法人工智能感兴趣的个人或团队开展相关研究,取得丰硕成果。

指导单位

最高人民法院信息中心

中国中文信息学会

共青团中央青年发展部

主办单位

中国司法大数据研究院

中国中文信息学会评测工委会

中国电科团委

承办单位

清华大学 自然语言处理与社会人文计算实验室

北京大学 计算机科学技术研究所

中国科学院软件研究所 中文信息处理研究室

指导委员会

许建峰 最高人民法院信息中心主任

王 珩 中国司法大数据研究院总经理

孙茂松 清华大学教授

孙 乐 中国科学院软件研究所研究员

评测委员会

刘知远 清华大学

冯岩松 北京大学

韩先培 中国科学院软件研究所

胡 振 中国司法大数据研究院

比赛设置

比赛采取业界常用的本地训练、在线评测的赛制,具体说明如下:

第一阶段:参赛队伍利用公开的数据训练模型,每周允许提交 3 次,平台将测试模型性能,并根据测试成绩排名;

第二阶段:第一阶段结束时,所有参赛者提交最终比赛模型(或以最后提交的模型为准)。同时,主办方将收集中国裁判文书网在随后一个月内每天新增的裁判文书数据作为新的测试集,对各参赛者的模型进行封闭评测,得到最终成绩。

竞赛详情

竞赛任务:

本次竞赛的任务共有 3 个,分别是罪名预测,法律条款推荐,刑期预测。参赛选手可以选择其中的一个或者多个任务进行挑战。

  • 罪名预测:提供文书中的案情描述和事实部分,预测被告人的罪名。

  • 法律条款推荐:提供文书中的案情描述,预测本案涉及的相关法条。

  • 刑期预测:对于刑事案件,根据案情描述和事实认定,预测被告人的刑期长短。

数据简介:

本次挑战赛所使用的数据集是来自「中国裁判文书网」公开的刑事法律文书,其中每份数据由法律文书中的案情描述和事实部分组成,同时也包括每个案件所涉及的法条、被告人被判的罪名和刑期长短等要素。

数据集共包括 268 万份刑法法律文书,共涉及 183 条罪名,202 条法条,刑期长短包括 0-25 年、无期、死刑。

我们将先后发布 CAIL2018-Small 和 CAIL2018-Large 两组数据集。CAIL2018-Small 包括 19.6 万份文书样例,直接在该网站发布,包括 15 万训练集,1.6 万验证集和 3 万测试集。这部分数据可以自由下载,供参赛者前期训练和测试。比赛开始 2-3 周后(具体时间请关注比赛新闻),我们将通过邮寄 U 盘(或网络下载)向有资格的参赛队伍定向发布 CAIL2018-Large 数据集,包括 150 万份文书样例。最后,剩余 90 万份文书将作为第一阶段的测试数据 CAIL2018-Large-test。

参赛方式

参赛对象:

本次技术竞赛面向全社会开放,相关领域的个人、科研机构、高等院校、企业单位等人员均可报名参加。

报名方式:

竞赛网站将于 2018 年 4 月 15 日开放注册报名,请及时关注比赛主页(http://cail.cipsc.org.cn/)。

报名时间:

2018 年 5 月 1 日至 2018 年 7 月 14 日。

奖项设置:

参赛选手将根据排名情况分享九万奖金。另外还将为获奖者提供由最高人民法院信息中心提供的荣誉证书认证。

对了,我们招人了,了解一下?

BAT资深算法工程师独家研发课程

最贴近生活与工作的好玩实操项目

班级管理助学搭配专业的助教答疑

学以致用拿offer,学完即推荐就业

扫码或点击阅读原文了解一下!


┏(^0^)┛欢迎分享,明天见!

登录查看更多
0

相关内容

中国中文信息学会成立于1981年6月。钱伟长、甄健民、安其春等为主要发起人。

中国中文信息学会是依法成立并经中国科学技术协会接纳的科学技术工作者的学术性群众团体,是具有独立社团法人资格的国家一级学会。

学会的宗旨是提倡辨证唯物主义,坚持实事求是的科学态度,贯彻“百花齐放,百家争鸣”的方针,充分发扬民主,开展学术上的自由讨论。团结中文信息处理学科的广大科技工作者及海外学术界朋友,为促进学科发展、繁荣我国中文信息处理事业而努力。

中国中文信息学会是党领导下的科技工作者的群众组织,是党和政府联系科技工作者的桥梁和纽带。在不断深化改革,继续拓展新的工作领域的同时,进一步树立学术交流主渠道、科普工作主力军、国际民间科技交流重要代表和“科技工作者之家”的鲜明社会形象,努力建成具有中国特色的科技工作者自己的组织。

学会的学术研究内容是利用计算机对汉语的音、形、义等语言文字信息进行的加工和操作,包括对字、词、短语、句、篇章的输入、输出、识别、转换、压缩、存储、检索、分析、理解和生成等各方面的处理技术。中文信息处理学科是在语言文字学、计算机应用技术、人工智能、认知心理学和数学等相关学科的基础上形成的一门新兴的边缘学科。

学会始终把开展国内外学术交流作为中心工作,并开展技术咨询服务、办好学会刊物,编辑出版学术书刊等。中国中文信息学会和挂靠单位中国科学院软件研究所联合主办的学术刊物是《中文信息学报》。

2011年12月产生学会第七届理事会:

理事长:李生
      副理事长:黄河燕 刘庆峰 刘迎建 施水才 孙乐 孙茂松 吾守尔•斯拉木 徐 波 张桂平
      秘书长:孙 乐

2006年11月产生学会第六届理事会:

理事长:倪光南
      副理事长:曹右琦(女,常务副理事长) 陈肇雄 李 生 刘迎建 孙茂松 徐 波 赵 琛
      秘书长:孙 乐

人机对抗智能技术
专知会员服务
189+阅读 · 2020年5月3日
面向司法案件的案情知识图谱自动构建
专知会员服务
122+阅读 · 2020年4月17日
电力人工智能发展报告,33页ppt
专知会员服务
120+阅读 · 2019年12月25日
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
易观联合清华海峡研究院成立人工智能实验室
Analysys易观
4+阅读 · 2017年10月28日
报名 | 知识图谱技术和在司法领域的应用讲座
数据派THU
6+阅读 · 2017年9月12日
报名 | 知识图谱技术和在司法领域的应用
THU数据派
24+阅读 · 2017年9月11日
Arxiv
5+阅读 · 2020年3月26日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
6+阅读 · 2017年12月2日
VIP会员
Top
微信扫码咨询专知VIP会员