73

Microsoft语音语言翻译(MSLT)语料库

Microsoft Speech Language Translation (MSLT) Corpus

语料库 语音识别 微软研究院

包含Microsoft Research收集的英语,中文和日语的会话,双语语音测试和调音数据。该软件包包括音频数据,成绩单和翻译,并允许在真实数据上对口语翻译系统进行端到端测试。

免积分下载
数据集市
2020年06月23日

相关数据

MS-微软语音语料库(印度语)
MS-微软语音语料库(印度语)
Microsoft Speech Corpus(印度语言)发... 免积分下载
说话人深度识别数据集(VoxCeleb2)
说话人深度识别数据集(VoxCeleb2)
VoxCeleb是一个视听数据集,由从上传到YouTube的... 免积分下载
TIMIT 语料库
TIMIT 语料库
TIMIT数据集的语音采样频率为16kHz,共包含6300个... 免积分下载

数据介绍

该语料库是为了评估端到端会话语音翻译质量而创建的。语料库是通过Skype上的实际对话创建的,我们提供了有关录制设置以及相关文本数据不同层的详细信息。

语料库版本包括Test和Dev集,以及用于语音识别的参考成绩单。

此外,还提供清理的成绩单和参考翻译,以评估机器翻译的质量。此处介绍的IWSLT 2016发行版包括源音频,原始成绩单,清理的成绩单以及法语和德语的英语翻译。

还没有任何文件记录.