助力中文文字识别突破,美团公开首个真实场景招牌图像数据集

2019 年 2 月 28 日 美团技术团队

总第340篇

2019年 第18篇


美美导读:美团联合国内外知名科研机构和学者,在ICDAR2019大会主办"中文门脸招牌文字识别"比赛,聚焦中文识别难题,打造业界首个真实场景招牌图像数据集,10万奖金等你来!



美团作为全球最大的本地生活服务平台,拥有由遍布全国的市场人员所拍摄的众多门脸招牌图片数据。每张图片都是由全国的不同个人,采用不同设备,在不同地点,不同时间和不同环境下所拍摄的不同目标,是难得的可以公正评价算法鲁棒性和识别效果的图片数据,挑战也非常大。

近年来业界围绕着文字检测和文字识别提出了许多有效的算法和技术方案。由于之前公开的数据集普遍以英文为主,因此所提出的技术方案对中文特有问题关注不足。表现在以中文为主的实际应用场景中,这些技术方案的结果与应用预期差距较大。以美团掌握的某典型中文图片数据为例,在6000张图的图片数据集上(已去除文字无法辨识的图片),测试了国内最知名的三个AI开放平台,按字段统计识别率分别是94%,91% 和 86%,经过努力我们也只达到 98%。中文OCR在实际应用场景的表现并不乐观。

在此次 ICDAR2019上,我们挑选出很能代表中文特点的餐饮商家的门脸招牌图片来组织竞赛,这些招牌上的文字存在中文特有的设计和排版,同时也兼有自然场景文字识别中普遍存在的拍照角度、光照变化等干扰因素。我们希望通过竞赛引起同行们对中文识别的关注,群策群力解决中文识别的实际问题。

会议与大赛介绍

国际文档分析与识别国际会议 (International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会(IAPR)组织的专业会议之一,专注于文本领域的识别与应用。ICDAR大会每两年举办一次,目前已发展成文字识别领域的旗舰学术会议。为了提高自然场景的文本检测和识别水平,国际文档分析和识别会议(ICDAR)于2003年设立了鲁棒文本阅读竞赛(“Robust Reading Competitions”)。至今已有来自89个国家的3500多支队伍参与。

ICDAR 2019将于今年9月20-25日在澳大利亚悉尼举办。 美团今年联合国内外知名科研机构和学者,提出了"中文门脸招牌文字识别"比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。

组织者

  • 王栋、张睿、刘曦、周永生,美团

  • 白翔、廖明辉、杨明锟,华中科技大学

  • Baoguang Shi, Microsoft (Redmond,USA)

  • Shijian Lu, Nanyang Technological University (Singapore)

  • Dimosthenis Karatzas,Computer Vision Centre,UAB(Spain

  • C. V. Jawahar,IIIT Hyderabad(India

数据集介绍

美团本次公开的数据,由遍布全国的市场人员所拍摄的众多门脸招牌图片组成,共25000张。每张图片是由完全独立的不同个人,采用不同设备,在不同地点,不同时间和不同环境下所拍摄的不同商家。该数据集以中文文字为主,也包含一定数量的英文和数字,英文和数字的占比介于 10% 和 30% 之间。标注内容比较完备,每张图片均标注了单个字符的位置和文本,以及各字符串的位置和文本。是难得的用于研发和评估中文识别技术的数据集。其中,20000张图片用于训练,2000张用于验证,3000张用于测试。

数据集示例

比赛内容

本次门脸招牌识别,共定义了 4 个任务,分别如下:

  • TASK 1:招牌端到端文字识别

  • TASK 2:招牌文字行定位

  • TASK 3:招牌区域内单字识别

  • TASK 4:招牌区域内字符串识别

奖励方式

  • 颁发奖状:按照最终成绩进行排名,以从高至低顺序依次选取前三名,颁发奖状。

  • 比赛奖金:从高至低顺序选取前三名参赛方为学校及科研院所等非盈利机构。

    • 奖金详细如下:

重要日期

  • 2019年3月1日:报名通道开放

  • 2019年3月18日:训练数据集开放

  • 2019年4月15日:测试数据集分批开放

  • 2019年4月16日:提交通道开放

  • 2019年4月30日:提交截止日期

  • 2019年5月10日:比赛最终报告提交

  • 2019年9月20日:ICDAR 2019 大会召开

参赛报名

  • 点击“阅读原文”,或扫描下方二维码,直接进入报名链接报名。

参赛答疑与交流

  • 参赛答疑邮箱:mtdptech@meituan.com邮件标题请注明 “ICDAR2019

  • 加入参赛交流微信群

    • 步骤1:微信添加 “MTDPtech02” 为好友(昵称:美美),或扫描下方二维码直接添加:

    • 步骤2:回复美美 “ICDAR2019”,则会自动将您加入ICDAR2019-ReCTS技术交流群

----------  END  ----------


登录查看更多
0

相关内容

ICDAR是一个非常成功的旗舰会议系列,是文献分析界研究人员、科学家和实践者的最大和最重要的国际会议。该会议得到了IAPR-TC 10/11的认可,成立于近30年前。第15届文件分析与识别国际会议(ICDAR 2019)由澳大利亚悉尼科技大学(UTS)主办,并在悉尼国际会议中心(ICC)举行。接受的论文由会议出版服务(CPS)出版,并提交给IEEE Xplore数字图书馆。官网链接:http://icdar2019.org/
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【紫冬快讯】夺冠!自动化所团队拔得CVPR2019 UG2+人脸识别竞赛头筹
中国科学院自动化研究所
9+阅读 · 2019年6月22日
腾讯数平精准推荐 | OCR技术之检测篇
机器学习研究会
13+阅读 · 2018年3月17日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
微信OCR(1)——公众号图文识别中的文本检测
微信AI
17+阅读 · 2017年11月22日
Multi-Grained Named Entity Recognition
Arxiv
6+阅读 · 2019年6月20日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Arxiv
3+阅读 · 2017年11月12日
VIP会员
相关VIP内容
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Top
微信扫码咨询专知VIP会员