MERL 购物数据集由 106 个视频组成,每个视频的序列大约为 2 分钟。这些视频来自一个固定的头顶摄像头,向下看人们在杂货店购物。
MERL 购物数据集由 106 个视频组成,每个视频的序列大约为 2 分钟。这些视频来自一个固定的头顶摄像头,向下看人们在杂货店购物。每个视频都包含以下 5 个动作的多个实例:"到达货架"(把手伸进货架)、"从货架上收回"(从货架上收回手)、"手放在货架上"(手放在货架上的延长期)、"检查产品"(在手握产品时检查产品)和"检查货架"(在触摸或接触货架时查看货架)。
此数据集可免费下载,用于以下研究目的:
ftp.merl.com/pub/tmarks/MERL_Shopping_Dataset/
数据引用:
Singh, B., Marks, T.K., Jones, M.J., Tuzel, C.O., Shao, M., "A Multi-Stream Bi-Directional Recurrent Neural Network for Fine-Grained Action Detection", IEEE Conference on Computer Vision and Pattern Recognition (CVPR), DOI: 10.1109/CVPR.2016.216, June 2016, pp. 1961-1970.