MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据
MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据,其中分为训练集712.09小时、开发集14.84小时和测试集28.08小时。本语料库的录制文本覆盖多样化的使用场景,包括互动问答、音乐搜索、口语短信信息、家居命令控制等。采集方式为手机录音,涵盖多种类型的安卓手机;录音输出为PCM格式。1000名来自中国不同口音区域的发言人参与采集。MagicData中文手机录音音频语料库由MagicData有限公司开发,免费发布供非商业使用。
数据包:https://freedata.oss-cn-beijing.aliyuncs.com/MAGICDATA_Mandarin_Chinese_Speech.zip
语音时长 | 755小时 |
开发集 | 14.84小时 |
测试集 | 28.08小时 |
训练集 | 712.09小时 |
音频格式 | PCM |
发音人数量 | 1000人 |
录音方式 | 手机录音 |
版权所有 | 爱数智慧 MagicData |