2568

说话人深度识别数据集(VoxCeleb2)

VoxCeleb2

VoxCeleb YouTube 语音识别 声纹识别 短语音 声音片段

VoxCeleb是一个视听数据集,由从上传到YouTube的采访视频中提取的人类语音短片组成。

免积分下载
大雄
2019年06月30日

相关数据

MS-微软语音语料库(印度语)
MS-微软语音语料库(印度语)
Microsoft Speech Corpus(印度语言)发... 免积分下载
TIMIT 语料库
TIMIT 语料库
TIMIT数据集的语音采样频率为16kHz,共包含6300个... 免积分下载
Warblr众包语音数据集
Warblr众包语音数据集
来自英国各地的10,000个10秒的智能手机音频录音,音频总... 免积分下载

数据介绍

VoxCeleb2包含超过100万个6,112个名人的话语,从上传到YouTube的视频中提取,VoxCeleb2已经与VoxCeleb1或SITW数据集没有重叠的说话人身份。

数据规格

发音人数量 训练集:5994,测试集:118
视频数量 训练集:145569,测试集:4911
音频数量 训练集:1092009,测试集:36237
内容时长 2000小时以上
发布时间 2018年
还没有任何文件记录.