WIDER FACE共包括3万多张图片近40万个人脸,是目前国际上规模最大、场景最为复杂、难度和挑战性最高的人脸检测公开数据集。
MegaFace是由美国华盛顿大学计算机科学与工程实验室发布并维护的一套公开人脸数据集,是一个一百万规模级别的面部识别算法测试基准,资料集共包含690,572个身份共1,027,060张图像。
比ImageNet大的图像数据集来了;总共包含63万张图像数量,覆盖365个类别数量,高达 1000 万的框数,超越了Pascal VOC、ImageNet、COCO数据集。
Youtube face dataset 是一个人脸视频数据,包括1595人的3425段视频剪辑,每个人平均有2.15段视频剪辑。
由于美国国家标准化研究院(NIST)发布的大型人脸数据集,包括从互联网采集的静态人脸图像和视频,共有1845个对象,11754张图片,55026视频帧,7011个视频和10044非人脸图像。
GENKI数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三个部分
HMDB 是一个人类动作视频数据,包含 6849段 视频剪辑,51个 人类动作类别,每类动作至少包含 101段 视频剪辑。
ETHZ Synthesizability 是一个纹理图像数据,包含 21302 个纹理图片
Caltech-UCSD Birds 200 是一个鸟类图片数据集,包含 200 不同种鸟类,共计 11788 张图片。
DCIGN人脸数据集是采用深度网络 Deep Convolutional Inverse Graphics Network 进行人脸特征建模,旨在构建剔除人脸角度、光照、材质等外生条件的人脸模型。
Caltech-256 是一个图像物体识别数据集,包含 30608 张图片,256个物体类别,每类图片最少80张,最多827张。