VoxCeleb, 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。
VoxCeleb, 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。开发集和测试集之间没有重叠。对大明星所说的话进行分类并识别——这是一项有趣的工作。
该数据集有2个子集: VoxCeleb1 和 VoxCeleb2
数据协议 | Creative Commons Attribution-ShareAlike 4.0 International License |
发音人数量 | 训练集:5994,测试集:118 |
视频数量 | 训练集:145569,测试集:4911 |
音频数量 | 训练集:1092009,测试集:36237 |
内容时长 | 2000小时以上 |
发布时间 | 2018年 |