ESC 数据集是一组以统一格式提供的短期环境记录(5 秒长剪辑、44.1 kHz、单通道、Ogg Vorbis 压缩 = 192 kbit/s)。
ESC 数据集是一组以统一格式提供的短期环境记录(5 秒长剪辑、44.1 kHz、单通道、Ogg Vorbis 压缩 = 192 kbit/s)。所有剪辑都从通过项目项目获得的公共Freesound.org中提取。有关详细归因列表,请参阅 README 文件。数据集根据知识共享许可证的条款 -归因 - 非商业。
数据集由三部分组成:
ESC-US 数据集虽然不是手工注释,但包括原始上传用户提交的标签(标签),这些标签可能用于监督不力的学习(嘈杂和/或缺少标签)。ESC-10 和 ESC-50 数据集已预先安排成 5 个大小均匀的折叠,以便从同一原始源录制中提取的剪辑始终包含在单个折叠中。
标记的数据集也可以作为 GitHub 项目提供:ESC-50 |ESC-10.
如是更详尽的描述和分析,请参阅原始纸张和补充的 IPython 笔记本。
该项目的目标是促进环境声音分类领域的公开研究举措,因为该领域的公开数据集仍然相当稀少。