TIMIT 语料库

The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus

TIMIT 语料英语语音识别

TIMIT数据集的语音采样频率为16kHz，共包含6300个句子，由来自美国八个主要方言地区的630人每人说出给定的10个句子，所有的句子都在音素级别（phone level）上进行了手动分割，标记。

下载所需积分：免积分下载

数据集发布者：数据集市

发布时间： 2019年09月17日

数据大小： 826MB

查看原始数据

数据介绍

TIMIT（英语：The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus），是由德州仪器、麻省理工学院和SRI International合作构建的声学－音素连续语音语料库。TIMIT数据集的语音采样频率为16kHz，一共包含6300个句子，由来自美国八个主要方言地区的630个人每人说出给定的10个句子，所有的句子都在音素级别（phone level）上进行了手动分割，标记。

70%的说话人是男性；大多数说话者是成年白人。

TIMIT语料库多年来已经成为语音识别社区的一个标准数据库，在今天仍被广为使用。其原因主要有两个方面：数据集中的每一个句子都在音素级别上进行了手动标记，同时提供了说话人的编号，性别，方言种类等多种信息；数据集相对来说比较小，可以在较短的时间内完成整个实验；同时又足以展现系统的性能。

数据规格

语音采样频率	16kHz
句子数量	6300
录音人数量	630
男女比例	70%男，30%女
发布时间	1993年
语言	英语
许可协议	LDC User Agreement for Non-Members https://catalog.ldc.upenn.edu/license/ldc-non-members-agreement.pdf
版权所属	Portions © 1993 Trustees of the University of Pennsylvania

还没有任何文件记录.

TIMIT 语料库

The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus

相关数据

MS-微软语音语料库（印度语）

VoxForge 语音库

说话人深度识别数据集（VoxCeleb2）

数据介绍

数据规格