这是一个综合生成的数据集,其中将单词实例放置在自然场景图像中,同时考虑了场景布局。
这是一个综合生成的数据集,其中将单词实例放置在自然场景图像中,同时考虑了场景布局。
数据集由80万幅图像组成,其中包含约800万个合成词实例。每个文本实例都用其文本字符串,单词级和字符级的边界框进行注释。
@InProceedings{Gupta16, author = "Ankush Gupta and Andrea Vedaldi and Andrew Zisserman", title = "Synthetic Data for Text Localisation in Natural Images", booktitle = "IEEE Conference on Computer Vision and Pattern Recognition", year = "2016", }
图片数量 | 约80万 |
合成词实例 | 800万个 |
作者 | 安库什· 古普塔( Andk Vupaldi)和安德鲁·齐达曼( Andrew Zisserman) |
发布时间 | 2016年 |