该数据集包含僧伽罗语的多扬声器高质量转录音频数据,由斯里兰卡的Google收集。
该数据集包含僧伽罗语的多扬声器高质量转录音频数据。数据集由wave文件和TSV文件组成。
si_lk.lines.txt文件包含一个FileID,其后包含文件中的UserID和音频转录。
数据集已经过手动质量检查,但可能仍然存在错误。
该数据集由斯里兰卡的Google收集。
请参阅LICENSE.txt文件以获取许可证信息。
版权所有2015、2016 Google,Inc.
下载
si_lk.tar.gz [699M](音频文件)镜子: [中国] si_lk.lines.txt [197K](音频转录)镜子: [中国] README.txt [ 479字节](其他自述文件)镜像: [中国] LICENSE.txt [20K](许可信息)镜像: [中国]