大型的单人语音数据集
《世界英语圣经》是将1901年美国标准版更新为现代英语的公有领域。
其音频录音可从http://www.audiotreasure.com/免费获得。
在与语音相关的任务中使用这些文件时,唯一的问题是每个文件都太长。这就是为什么我将每个音频文件分割成一个音频剪辑等同于一首诗的原因。随后,我将它们与文本对齐。
数据内容
该数据集由以下组成:
transcript.txt
以制表符分隔的格式。第一列是音频文件路径。第二个是脚本。最后,最右边的列是音频文件的持续时间。