1378

TIMIT 语料库

The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus

TIMIT 语料 英语 语音识别

TIMIT数据集的语音采样频率为16kHz,共包含6300个句子,由来自美国八个主要方言地区的630人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。

免积分下载
数据集市
2019年09月17日
826MB

相关数据

MS-微软语音语料库(印度语)
MS-微软语音语料库(印度语)
Microsoft Speech Corpus(印度语言)发... 免积分下载
说话人深度识别数据集(VoxCeleb2)
说话人深度识别数据集(VoxCeleb2)
VoxCeleb是一个视听数据集,由从上传到YouTube的... 免积分下载
Warblr众包语音数据集
Warblr众包语音数据集
来自英国各地的10,000个10秒的智能手机音频录音,音频总... 免积分下载

数据介绍

TIMIT(英语:The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus),是由德州仪器、麻省理工学院和SRI International合作构建的声学-音素连续语音语料库。TIMIT数据集的语音采样频率为16kHz,一共包含6300个句子,由来自美国八个主要方言地区的630个人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。

70%的说话人是男性;大多数说话者是成年白人。

TIMIT语料库多年来已经成为语音识别社区的一个标准数据库,在今天仍被广为使用。其原因主要有两个方面: 数据集中的每一个句子都在音素级别上进行了手动标记,同时提供了说话人的编号,性别,方言种类等多种信息; 数据集相对来说比较小,可以在较短的时间内完成整个实验;同时又足以展现系统的性能。

数据规格

语音采样频率 16kHz
句子数量 6300
录音人数量 630
男女比例 70%男,30%女
发布时间 1993年
语言 英语
许可协议 LDC User Agreement for Non-Members
https://catalog.ldc.upenn.edu/license/ldc-non-members-agreement.pdf
版权所属 Portions © 1993 Trustees of the University of Pennsylvania
还没有任何文件记录.