5619

自然环境下合成文本OCR图像数据集

SynthText in the Wild Dataset

OCR 文字识别 合成文字

这是一个综合生成的数据集,其中将单词实例放置在自然场景图像中,同时考虑了场景布局。

免积分下载
数据集市
2019年12月12日
41G

相关数据

食品产品数据库(Open Food Facts)
食品产品数据库(Open Food Facts)
Open Food Facts是一个免费,开放,可比较的来自... 免积分下载
坠落检测数据集
坠落检测数据集
数据来自论文《Fall Detection》 免积分下载
三国人物结构化数据
三国人物结构化数据
来自github的一个三国人物信息数据集;数据主要整理自 维... 免积分下载

数据介绍

这是一个综合生成的数据集,其中将单词实例放置在自然场景图像中,同时考虑了场景布局。

数据集由80万幅图像组成,其中包含约800万个合成词实例。每个文本实例都用其文本字符串,单词级和字符级的边界框进行注释。

@InProceedings{Gupta16, author = "Ankush Gupta and Andrea Vedaldi and Andrew Zisserman", title = "Synthetic Data for Text Localisation in Natural Images", booktitle = "IEEE Conference on Computer Vision and Pattern Recognition", year = "2016", }

数据规格

图片数量 约80万
合成词实例 800万个
作者 安库什· 古普塔( Andk Vupaldi)和安德鲁·齐达曼( Andrew Zisserman)
发布时间 2016年
还没有任何文件记录.