6063

ESC环境噪音分类数据集

ESC Dataset

ESC 噪音识别 语音识别

ESC 数据集是一组以统一格式提供的短期环境记录(5 秒长剪辑、44.1 kHz、单通道、Ogg Vorbis 压缩 = 192 kbit/s)。

免积分下载
数据集市
2020年12月31日
26.8GB

相关数据

MS-微软语音语料库(印度语)
MS-微软语音语料库(印度语)
Microsoft Speech Corpus(印度语言)发... 免积分下载
VoxForge 语音库
VoxForge 语音库
VoxForge 创建的初衷是为免费和开源的语音识别引擎收集... 免积分下载
说话人深度识别数据集(VoxCeleb2)
说话人深度识别数据集(VoxCeleb2)
VoxCeleb是一个视听数据集,由从上传到YouTube的... 免积分下载

数据介绍

ESC 数据集是一组以统一格式提供的短期环境记录(5 秒长剪辑、44.1 kHz、单通道、Ogg Vorbis 压缩 = 192 kbit/s)。所有剪辑都从通过项目项目获得的公共Freesound.org中提取。有关详细归因列表,请参阅 README 文件。数据集根据知识共享许可证的条款 -归因 - 非商业

数据集由三部分组成:

  • **ESC-50:**一组有 2,000 个环境记录(50 个类,每类 40 个剪辑),
  • **ESC-10:**一组有 400 个环境记录(每类 10 个类,40 个剪辑)(这是 ESC-50 的子集 - 创建初始化,作为概念验证/简单录制的标准化选择),
  • **ESC-US:**一个未标记的数据集,包含 25 万个环境记录(5 秒长的剪辑),适合无监督的预培训。

ESC-US 数据集虽然不是手工注释,但包括原始上传用户提交的标签(标签),这些标签可能用于监督不力的学习(嘈杂和/或缺少标签)。ESC-10 和 ESC-50 数据集已预先安排成 5 个大小均匀的折叠,以便从同一原始源录制中提取的剪辑始终包含在单个折叠中。

标记的数据集也可以作为 GitHub 项目提供:ESC-50 |ESC-10.

如是更详尽的描述和分析,请参阅原始纸张和补充的 IPython 笔记本


该项目的目标是促进环境声音分类领域的公开研究举措,因为该领域的公开数据集仍然相当稀少。

还没有任何文件记录.