数据集共包含2688张照片,主要是室外自然风景和城市建筑,适用于语义分割研究。
数据库包含了 10个动作(bend, jack, jump, pjump, run,side, skip, walk, wave1,wave2),每个动作有 9 个不同的样本。
智能手机图像去噪数据集(SIDD)使用5个具有代表性的智能手机摄像头,从10个场景中提取约30000个噪声图像,并生成它们真实的场景图像。
Celeb-DF(v2)数据集包含真实和DeepFake合成视频,其视频质量与在线传播的视频质量相似。
ArT是Total Text、SCUT-CTW1500和Baidu Curve Scene Text的组合,收集这些文本的目的是将任意形状的文本问题引入Scene Text社区。
TOTAL-TEXT是基于单词级别的英语曲线文本数据集。如果您对具有英文和中文实例的基于文本行的数据集感兴趣,我们强烈建议您参考SCUT-CTW1500。
WiderPerson数据集是比较拥挤场景的行人检测基准数据集,其图像是从多种场景中选择的,不再局限于交通场景。 包含13382张图像,并标注了大约40万个各种不同的遮挡标记。
VisDrone2019数据集由中国天津大学机器学习和数据挖掘实验室的AISKYEYE团队收集。基准数据集包含288个视频片段,261,908个帧和10,209个帧组成静态图像。
这是一个汽车3D对象检测数据集,来自ASTYX公司。
它由两种手动注释组成。HACS 剪辑包含155万2 秒剪辑标注;HACS 段在 50000个视频上具有完整的操作片段(从操作开始到结束)。
基于KITTI数据集的自动驾驶数据集,用来推动基于激光的语义分割研究。