ArT是Total Text、SCUT-CTW1500和Baidu Curve Scene Text的组合,收集这些文本的目的是将任意形状的文本问题引入Scene Text社区。
ArT是Total Text、SCUT-CTW1500和Baidu Curve Scene Text的组合,收集这些文本的目的是将任意形状的文本问题引入Scene Text社区。
在现有3055张图像的基础之上,将超过7111张图像添加到两个数据集的混合中,这使ArT成为当今规模更大的场景文本数据集之一。ArT数据集中共有10,166张图像。它分为带有5603个图像的训练集和包含4563个新收集的图像的测试集。考虑到ArT数据集的收集时考虑到了文字形状的多样性,因此所有现有的文字形状(即水平,多向和弯曲)在数据集中都存在很多,这使其成为唯一的数据集,因为大多数现有数据集仅由水平和多向文本实例主导。
ArT数据集中的文本实例带有(a)四边形边界框,8、10和12顶点多边形边界框(在Tasks选项卡中有更多详细信息)和(b)转录注释。这两个注释均满足(a)文本检测,(b)识别和(c)此挑战提出的文本发现任务。
数据下载需要进行注册。 https://rrc.cvc.uab.es/?ch=14&com=downloads
发布时间 | 2019年 |
图片数量 | 10,166 |