12178

人类语音的大规模视听数据集 (VoxCeleb)

VoxCeleb

VoxCeleb 声纹识别 语音识别 语音数据集 YouTube

VoxCeleb, 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。

免积分下载
大雄
2019年06月30日

相关数据

MS-微软语音语料库(印度语)
MS-微软语音语料库(印度语)
Microsoft Speech Corpus(印度语言)发... 免积分下载
VoxForge 语音库
VoxForge 语音库
VoxForge 创建的初衷是为免费和开源的语音识别引擎收集... 免积分下载
说话人深度识别数据集(VoxCeleb2)
说话人深度识别数据集(VoxCeleb2)
VoxCeleb是一个视听数据集,由从上传到YouTube的... 免积分下载

数据介绍

VoxCeleb, 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。开发集和测试集之间没有重叠。对大明星所说的话进行分类并识别——这是一项有趣的工作。

该数据集有2个子集: VoxCeleb1 和 VoxCeleb2

数据规格

数据协议 Creative Commons Attribution-ShareAlike 4.0 International License
发音人数量 训练集:5994,测试集:118
视频数量 训练集:145569,测试集:4911
音频数量 训练集:1092009,测试集:36237
内容时长 2000小时以上
发布时间 2018年
还没有任何文件记录.