该数据集是[免费音乐档案库(FMA)](https://freemusicarchive.org/)的转储,[FMA]是高质量合法音频下载的交互式库。
该数据集是免费音乐档案库(FMA)的转储,FMA是高质量合法音频下载的交互式库。下面摘自论文摘要 。
我们介绍了免费音乐档案(FMA),这是一个开放的且易于访问的数据集,适用于评估MIR中的多个任务,MIR是一个与浏览,搜索和组织大型音乐收藏有关的领域。但是,社区对功能和端到端学习的兴趣日益增长,这受到大型音频数据集可用性有限的限制。FMA旨在克服这一障碍,以161个流派的分级分类法,提供来自16,341位艺术家和14,854张专辑的106,574条曲目的917 GiB和343天的知识共享许可。它提供了全长和高质量的音频,预先计算的功能,以及轨道和用户级别的元数据,标签以及诸如传记之类的自由格式文本。我们在这里描述数据集及其创建方式,提出训练/验证/测试划分以及三个子集,讨论一些合适的MIR任务,并评估一些用于体裁识别的基准。代码,数据和用法示例可从以下网站获得:https://github.com/mdeff/fma。
数据内容:
所有曲目的所有元数据和功能都分布在 fma_metadata.zip(342 MiB)中。下表可与熊猫或任何其他数据分析工具一起使用。有关说明,请参见纸张或用法笔记本。
tracks.csv
:所有106,574首曲目的每个曲目元数据,例如ID,标题,艺术家,流派,标签和播放计数。genres.csv
:所有163个流派ID及其名称和父级(用于推断流派层次和顶级流派)。features.csv
:用librosa提取的共同特征。echonest.csv
:由Echonest(现在为Spotify)提供的音频功能,可用于13,129首曲目的子集。然后,您得到了各种大小的MP3编码的音频数据:
数据引用:
@inproceedings{fma_dataset,
title = {FMA: A Dataset for Music Analysis},
author = {Defferrard, Micha\"el and Benzi, Kirell and Vandergheynst, Pierre and Bresson, Xavier},
booktitle = {18th International Society for Music Information Retrieval Conference},
year = {2017},
url = {https://arxiv.org/abs/1612.01840},
}
更多使用和介绍请查看来源页面。