KITTI是一系列以自动驾驶为目标的机器视觉任务数据,包括:空间建模、视觉流、视觉测距、3D物体检测、3D物体追踪等。
其中包含190万张图片,共计600个类别,共标记了1540万个边界框。这是目前带有对象位置标注的最大数据集。这些边界框大部分是由专业的注释人员手工绘制的,以确保准确性和一致性。
著名的猫图像标注数据集(Cat Annotation Dataset)原始数据,包含10000猫图像以及相应的猫轮廓标注。
包含8000万的32x32图像,CIFAR-10和CIFAR-100便是从中挑选的
这是用于开发对象检测算法的真实世界的图像数据集,它需要最少的数据预处理。它与MNIST数据集类似,但具有更多标签数据(超过600,000个图像),这些数据是从谷歌街景中查看的房屋号码中收集的。
MNIST是最受欢迎的深度学习数据集之一,包含一组60,000个示例的训练集和一个包含10,000个示例的测试集。