TUM 厨房数据集用于促进无标记人类运动捕获、运动分割和人类活动识别领域的研究。
自动识别并定位来自视频的大量动作类别,这对于视频理解和多媒体事件检测非常重要。 THUMOS研讨会和挑战旨在在现实的环境中,通过从开源视频中获取大量课程,探索用于大规模动作识别的新挑战和方法。
数据集由 300 个视频剪辑组成,这些视频剪辑从 20 多个不同的电视节目中收集,包含 4 个互动:握手、多次击掌、拥抱和亲吻,以及不包含任何互动的剪辑。
失物招领数据集解决了自主驾驶应用中发现意外的小型道路危险(通常由货物丢失造成的)的问题。
回答有关给定图像的问题是一项艰巨的任务,既需要了解图像,也需要附带的查询。微软研究蒙特利尔的FigureQA数据集引入了一种新的可视化推理任务,专门用于图形图和图形的研究。
FingerPaint 数据集包含几个执行手势的个人的视频序列,由深度摄像机捕获。
条件文本到图像生成,现有研究主要侧重于在一个步骤中从可用的调理信息生成单个图像。一步一代以外的实际扩展是一个系统,该系统以迭代方式生成图像,但以持续的语言输入或反馈为条件。
Microsoft Research Action Data Set II是Microsoft Research Action Data Set的扩展版本。
这是用于人类动作检测实验的数据集。它由我们录制的许多视频序列组成。
Microsoft Research Cambridge的去马赛克数据集由原始图像集及其降级版本组成,可用于在线性空间和色彩空间中学习和评估去马赛克(以及可能的其他任务,例如去噪)。
这个新的数据集提供了前所未有的传感器记录数量(总共405个),包括部署在24个单独的身体部位上的多个IMU和红外(IR)传感器。
在剑桥的微软研究院,我们正在开发新的机器视觉算法,用于自动识别和分割许多不同的对象类别。我们对有监督和无监督的场景都感兴趣。