VisDrone2019数据集由中国天津大学机器学习和数据挖掘实验室的AISKYEYE团队收集。基准数据集包含288个视频片段,261,908个帧和10,209个帧组成静态图像。
配备摄像机的无人机或通用无人机已经快速部署到广泛的应用中,包括农业,航空摄影,快速交付和监视。因此,对从这些平台收集的视觉数据的自动理解变得非常困难,这使计算机视觉越来越紧密地应用于无人机。我们很高兴为大规模的基准测试提供详细说明的真实性,以完成各种重要的计算机视觉任务,称为VisDrone,以使视觉满足无人机的要求。
VisDrone2019数据集由中国天津大学机器学习和数据挖掘实验室的AISKYEYE团队收集。基准数据集包含288个视频片段,由261,908个帧和10,209个帧组成静态图像,由各种安装在无人机上的摄像头捕获,涵盖了广泛的方面,包括位置(从中国相距数千公里的14个不同城市中拍摄),环境(城市和乡村),物体(行人,车辆,自行车等) 。)和密度(稀疏和拥挤的场景)。
请注意,该数据集是在各种情况下以及在各种天气和光照条件下使用各种无人机平台(即具有不同模型的无人机)收集的。
这些对象框使用超过260 万个边界框手动标注,这些边界框是人们经常感兴趣的目标,例如行人,汽车,自行车和三轮车。还提供了一些重要属性,包括场景可见性,对象类别和遮挡,以提高数据利用率。
发布时间 | 2019年 |
收集者 | 天津大学机器学习和数据挖掘实验室的AISKYEYE团队 |
视频数量 | 288 |