6131

任意弯曲文本OCR数据集(ArT 2019)

ArT 2019

OCR ArT 文本发现 图片数据集 文字识别 扭曲文字识别

ArT是Total Text、SCUT-CTW1500和Baidu Curve Scene Text的组合,收集这些文本的目的是将任意形状的文本问题引入Scene Text社区。

免积分下载
数据集市
2019年12月23日

相关数据

Caltech-256 数据集
Caltech-256 数据集
Caltech-256 是一个图像物体识别数据集,包含 30... 免积分下载
猫的图片数据集
猫的图片数据集
超过9,000张带有面部标注特征的猫的图像数据集 免积分下载
CACD 跨年龄人脸识别和检索数据集
CACD 跨年龄人脸识别和检索数据集
CACD 数据集是一个用于跨年龄的人脸识别和检索的大规模数据... 免积分下载

数据介绍

ArT是Total Text、SCUT-CTW1500和Baidu Curve Scene Text的组合,收集这些文本的目的是将任意形状的文本问题引入Scene Text社区。

在现有3055张图像的基础之上,将超过7111张图像添加到两个数据集的混合中,这使ArT成为当今规模更大的场景文本数据集之一。ArT数据集中共有10,166张图像。它分为带有5603个图像的训练集和包含4563个新收集的图像的测试集。考虑到ArT数据集的收集时考虑到了文字形状的多样性,因此所有现有的文字形状(即水平,多向和弯曲)在数据集中都存在很多,这使其成为唯一的数据集,因为大多数现有数据集仅由水平和多向文本实例主导。

ArT数据集中的文本实例带有(a)四边形边界框,8、10和12顶点多边形边界框(在Tasks选项卡中有更多详细信息)和(b)转录注释。这两个注释均满足(a)文本检测,(b)识别和(c)此挑战提出的文本发现任务。

数据下载需要进行注册。 https://rrc.cvc.uab.es/?ch=14&com=downloads

数据规格

发布时间 2019年
图片数量 10,166
还没有任何文件记录.