4730

大型室外中文字符OCR标注数据集

A Large Chinese Text Dataset in the Wild

中文字符 OCR 室外字符 文字识别 汉字识别

主要包含32285张图片,共计1018402个汉字,3850个汉字类别。主要来自清华-腾讯100K数据集和腾讯街景数据集。

免积分下载
数据集市
2019年08月09日
36.23GB

相关数据

Caltech-256 数据集
Caltech-256 数据集
Caltech-256 是一个图像物体识别数据集,包含 30... 免积分下载
猫的图片数据集
猫的图片数据集
超过9,000张带有面部标注特征的猫的图像数据集 免积分下载
CACD 跨年龄人脸识别和检索数据集
CACD 跨年龄人脸识别和检索数据集
CACD 数据集是一个用于跨年龄的人脸识别和检索的大规模数据... 免积分下载

数据介绍

主要包含32285张图片,共计1018402个汉字,3850个汉字类别。主要来自清华-腾讯100K数据集和腾讯街景数据集。图片大小为2048*2048。

数据规格

图像数量 32,285
字符实例 1,018,402
字符类别 3,850
属性 6种
Bibtex @article{yuan2019ctw,
author = {Tai{-}Ling Yuan and Zhe Zhu and Kun Xu and Cheng{-}Jun Li and Tai{-}Jiang Mu and Shi{-}Min Hu},
title = {A Large Chinese Text Dataset in the Wild},
journal = {Journal of Computer Science and Technology},
volume = {34},
number = {3},
pages = {509--521},
year = {2019},
}
还没有任何文件记录.