视频内容包含:在一天的不同时间捕获三个彩色视频序列和照明设置:早晨、晚上、晴天、多云等,不同的驾驶环境:高速公路和城市;不同的交通状况:从轻型到密集的交通。
MERL 购物数据集由 106 个视频组成,每个视频的序列大约为 2 分钟。这些视频来自一个固定的头顶摄像头,向下看人们在杂货店购物。
TUM 厨房数据集用于促进无标记人类运动捕获、运动分割和人类活动识别领域的研究。
SYNTHIA是图像和注释的合成的一个数据集,其生成的目的是在驾驶场景的上下文中帮助语义分割和相关的场景理解问题。
UCF体育数据集包括一组从各种体育活动中收集的动作,这些动作通常在广播电视频道(如BBC和ESPN)上播放。这些视频片段是从包括BBC动画画廊和GettyImages在内的大量库存视频网站上获得的。
自动识别并定位来自视频的大量动作类别,这对于视频理解和多媒体事件检测非常重要。 THUMOS研讨会和挑战旨在在现实的环境中,通过从开源视频中获取大量课程,探索用于大规模动作识别的新挑战和方法。
数据集由 300 个视频剪辑组成,这些视频剪辑从 20 多个不同的电视节目中收集,包含 4 个互动:握手、多次击掌、拥抱和亲吻,以及不包含任何互动的剪辑。
1232条毒鸡汤短句,没事打开http://www.nows.fun/ 毕竟人生苦短都没苦笑过有什么意思!
失物招领数据集解决了自主驾驶应用中发现意外的小型道路危险(通常由货物丢失造成的)的问题。
包含 8 个体育赛事类别:划船(250 张)、羽毛球(200 张)、马球(182 张)、bocce(137 张)、滑雪板(190 张)、球拍(236 张)、帆船(190 张)和攀岩(194 张)。
汽车多传感器 (AMUSE) 数据集由惯性和其他互补传感器数据以及多个测试驱动器期间在实际交通场景中拍摄的单目、全向、高帧速率视觉数据相结合。