Libri-Light 提供 60 k 小时以上的无标签语音、用于有限监督的小型培训集(10 小时、1 小时或 10 分钟的标签语音)
ESC 数据集是一组以统一格式提供的短期环境记录(5 秒长剪辑、44.1 kHz、单通道、Ogg Vorbis 压缩 = 192 kbit/s)。
dsd100是一个数据集,包括100首不同风格的全长音乐曲目,以及它们各自独立的鼓、低音、人声和其他词干。
驾驶员理论考试试题数据集,包含科目一和科目四理论考试涉及的到的所有试题。
包含8个可用于文本分类的子数据集,样本大小从120K到3.6M,问题范围从2级到14级,数据来源于 DBPedia、Amazon、Yelp、Yahoo!、Sogou 和 AG