FMA音乐分析数据集

FMA

音乐语音识别

该数据集是[免费音乐档案库（FMA）](https://freemusicarchive.org/)的转储，[FMA]是高质量合法音频下载的交互式库。

下载所需积分：免积分下载

数据集发布者：数据集市

发布时间： 2020年05月19日

查看原始数据

数据介绍

该数据集是免费音乐档案库（FMA）的转储，FMA是高质量合法音频下载的交互式库。下面摘自论文摘要。

我们介绍了免费音乐档案（FMA），这是一个开放的且易于访问的数据集，适用于评估MIR中的多个任务，MIR是一个与浏览，搜索和组织大型音乐收藏有关的领域。但是，社区对功能和端到端学习的兴趣日益增长，这受到大型音频数据集可用性有限的限制。FMA旨在克服这一障碍，以161个流派的分级分类法，提供来自16,341位艺术家和14,854张专辑的106,574条曲目的917 GiB和343天的知识共享许可。它提供了全长和高质量的音频，预先计算的功能，以及轨道和用户级别的元数据，标签以及诸如传记之类的自由格式文本。我们在这里描述数据集及其创建方式，提出训练/验证/测试划分以及三个子集，讨论一些合适的MIR任务，并评估一些用于体裁识别的基准。代码，数据和用法示例可从以下网站获得：https://github.com/mdeff/fma。

数据内容：

所有曲目的所有元数据和功能都分布在 fma_metadata.zip（342 MiB）中。下表可与熊猫或任何其他数据分析工具一起使用。有关说明，请参见纸张或用法笔记本。

tracks.csv：所有106,574首曲目的每个曲目元数据，例如ID，标题，艺术家，流派，标签和播放计数。
genres.csv：所有163个流派ID及其名称和父级（用于推断流派层次和顶级流派）。
features.csv：用librosa提取的共同特征。
echonest.csv：由Echonest（现在为Spotify）提供的音频功能，可用于13,129首曲目的子集。

然后，您得到了各种大小的MP3编码的音频数据：

**fma_small.zip：8,000**首30秒曲目，8种平衡类型（类似GTZAN）（7.2 GiB）
**fma_medium.zip：25,000**首30秒曲目，16种不平衡类型（22 GiB）
**fma_large.zip：30**秒的106,574首曲目，161种不平衡类型（93 GiB）
**fma_full.zip：106,574**个未修饰的曲目，161个不平衡的类型（879 GiB）

数据引用：

@inproceedings{fma_dataset,
  title = {FMA: A Dataset for Music Analysis},
  author = {Defferrard, Micha\"el and Benzi, Kirell and Vandergheynst, Pierre and Bresson, Xavier},
  booktitle = {18th International Society for Music Information Retrieval Conference},
  year = {2017},
  url = {https://arxiv.org/abs/1612.01840},
}

更多使用和介绍请查看来源页面。

还没有任何文件记录.

FMA音乐分析数据集

FMA

相关数据

微软图像裁剪数据集；

TWDNE 二次元头像数据集

宠物精灵图像数据集

数据介绍