自然环境下合成文本OCR图像数据集

SynthText in the Wild Dataset

OCR 文字识别合成文字

这是一个综合生成的数据集，其中将单词实例放置在自然场景图像中，同时考虑了场景布局。

下载所需积分：免积分下载

数据集发布者：数据集市

发布时间： 2019年12月12日

数据大小： 41G

查看原始数据

相关数据

三国人物结构化数据

来自github的一个三国人物信息数据集；数据主要整理自维... 免积分下载

数据详情
文件信息

数据介绍

这是一个综合生成的数据集，其中将单词实例放置在自然场景图像中，同时考虑了场景布局。

数据集由80万幅图像组成，其中包含约800万个合成词实例。每个文本实例都用其文本字符串，单词级和字符级的边界框进行注释。

@InProceedings{Gupta16, author = "Ankush Gupta and Andrea Vedaldi and Andrew Zisserman", title = "Synthetic Data for Text Localisation in Natural Images", booktitle = "IEEE Conference on Computer Vision and Pattern Recognition", year = "2016", }

数据规格

图片数量	约80万
合成词实例	800万个
作者	安库什· 古普塔（ Andk Vupaldi）和安德鲁·齐达曼（ Andrew Zisserman）
发布时间	2016年

还没有任何文件记录.