6888

爱数智慧中文手机录音音频语料库(Mandarin Chinese Read Speech )

Mandarin Chinese Read Speech

录音 音频语料 手机录音 语音识别 PCM语料 语料 中文识别

MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据

免积分下载
数据集市
2019年05月16日
52.2GB

相关数据

MS-微软语音语料库(印度语)
MS-微软语音语料库(印度语)
Microsoft Speech Corpus(印度语言)发... 免积分下载
VoxForge 语音库
VoxForge 语音库
VoxForge 创建的初衷是为免费和开源的语音识别引擎收集... 免积分下载
说话人深度识别数据集(VoxCeleb2)
说话人深度识别数据集(VoxCeleb2)
VoxCeleb是一个视听数据集,由从上传到YouTube的... 免积分下载

数据介绍

MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据,其中分为训练集712.09小时、开发集14.84小时和测试集28.08小时。本语料库的录制文本覆盖多样化的使用场景,包括互动问答、音乐搜索、口语短信信息、家居命令控制等。采集方式为手机录音,涵盖多种类型的安卓手机;录音输出为PCM格式。1000名来自中国不同口音区域的发言人参与采集。MagicData中文手机录音音频语料库由MagicData有限公司开发,免费发布供非商业使用。

数据包:https://freedata.oss-cn-beijing.aliyuncs.com/MAGICDATA_Mandarin_Chinese_Speech.zip

数据规格

语音时长 755小时
开发集 14.84小时
测试集 28.08小时
训练集 712.09小时
音频格式 PCM
发音人数量 1000人
录音方式 手机录音
版权所有 爱数智慧 MagicData
还没有任何文件记录.