4864

FMA音乐分析数据集

FMA

音乐 语音识别

该数据集是[免费音乐档案库(FMA)](https://freemusicarchive.org/)的转储,[FMA]是高质量合法音频下载的交互式库。

免积分下载
数据集市
2020年05月19日

相关数据

微软图像裁剪数据集;
微软图像裁剪数据集;
图像裁剪数据集包含由经验丰富的摄影师手动裁剪的1000张图像... 免积分下载
TWDNE 二次元头像数据集
TWDNE 二次元头像数据集
TWDNE(This Waifu Does Not Exis... 免积分下载
宠物精灵图像数据集
宠物精灵图像数据集
从第1代到第7代的所有神奇宝贝的图像,以及它们的类型(主要和... 免积分下载

数据介绍

该数据集是免费音乐档案库(FMA)的转储,FMA是高质量合法音频下载的交互式库。下面摘自论文摘要 。

我们介绍了免费音乐档案(FMA),这是一个开放的且易于访问的数据集,适用于评估MIR中的多个任务,MIR是一个与浏览,搜索和组织大型音乐收藏有关的领域。但是,社区对功能和端到端学习的兴趣日益增长,这受到大型音频数据集可用性有限的限制。FMA旨在克服这一障碍,以161个流派的分级分类法,提供来自16,341位艺术家和14,854张专辑的106,574条曲目的917 GiB和343天的知识共享许可。它提供了全长和高质量的音频,预先计算的功能,以及轨道和用户级别的元数据,标签以及诸如传记之类的自由格式文本。我们在这里描述数据集及其创建方式,提出训练/验证/测试划分以及三个子集,讨论一些合适的MIR任务,并评估一些用于体裁识别的基准。代码,数据和用法示例可从以下网站获得:https://github.com/mdeff/fma。

数据内容:

所有曲目的所有元数据和功能都分布在 fma_metadata.zip(342 MiB)中。下表可与熊猫或任何其他数据分析工具一起使用。有关说明,请参见纸张用法笔记本。

  • tracks.csv:所有106,574首曲目的每个曲目元数据,例如ID,标题,艺术家,流派,标签和播放计数。
  • genres.csv:所有163个流派ID及其名称和父级(用于推断流派层次和顶级流派)。
  • features.csv:用librosa提取的共同特征。
  • echonest.csv:由Echonest(现在为Spotify)提供的音频功能,用于13,129首曲目的子集。

然后,您得到了各种大小的MP3编码的音频数据:

  1. **fma_small.zip:8,000**首30秒曲目,8种平衡类型(类似GTZAN)(7.2 GiB)
  2. **fma_medium.zip:25,000**首30秒曲目,16种不平衡类型(22 GiB)
  3. **fma_large.zip:30**秒的106,574首曲目,161种不平衡类型(93 GiB)
  4. **fma_full.zip:106,574**个未修饰的曲目,161个不平衡的类型(879 GiB)

数据引用:

@inproceedings{fma_dataset,
  title = {FMA: A Dataset for Music Analysis},
  author = {Defferrard, Micha\"el and Benzi, Kirell and Vandergheynst, Pierre and Bresson, Xavier},
  booktitle = {18th International Society for Music Information Retrieval Conference},
  year = {2017},
  url = {https://arxiv.org/abs/1612.01840},
}

更多使用和介绍请查看来源页面。

还没有任何文件记录.