搜狗实验室提供,来自若干新闻站点2012年6月—7月期间国内...
VoxCeleb是一个视听数据集,由从上传到YouTube的采访视频中提取的人类语音短片组成。
VoxCeleb, 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。
MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据