包含Microsoft Research收集的英语,中文和日语的会话,双语语音测试和调音数据。该软件包包括音频数据,成绩单和翻译,并允许在真实数据上对口语翻译系统进行端到端测试。
该语料库是为了评估端到端会话语音翻译质量而创建的。语料库是通过Skype上的实际对话创建的,我们提供了有关录制设置以及相关文本数据不同层的详细信息。
语料库版本包括Test和Dev集,以及用于语音识别的参考成绩单。
此外,还提供清理的成绩单和参考翻译,以评估机器翻译的质量。此处介绍的IWSLT 2016发行版包括源音频,原始成绩单,清理的成绩单以及法语和德语的英语翻译。