4473

说话人深度识别数据集(VoxCeleb2)

VoxCeleb2

VoxCeleb YouTube 语音识别 声纹识别 短语音 声音片段

VoxCeleb是一个视听数据集,由从上传到YouTube的采访视频中提取的人类语音短片组成。

免积分下载
大雄
2019年06月30日

相关数据

MS-微软语音语料库(印度语)
MS-微软语音语料库(印度语)
Microsoft Speech Corpus(印度语言)发... 免积分下载
VoxForge 语音库
VoxForge 语音库
VoxForge 创建的初衷是为免费和开源的语音识别引擎收集... 免积分下载
ESC环境噪音分类数据集
ESC环境噪音分类数据集
ESC 数据集是一组以统一格式提供的短期环境记录(5 秒长剪... 免积分下载

数据介绍

VoxCeleb2包含超过100万个6,112个名人的话语,从上传到YouTube的视频中提取,VoxCeleb2已经与VoxCeleb1或SITW数据集没有重叠的说话人身份。

数据规格

发音人数量 训练集:5994,测试集:118
视频数量 训练集:145569,测试集:4911
音频数量 训练集:1092009,测试集:36237
内容时长 2000小时以上
发布时间 2018年
还没有任何文件记录.