排序方式:默认,数量:21
MS-微软语音语料库(印度语)

MS-微软语音语料库(印度语)

Microsoft Speech Corpus (Indian languages)
211

Microsoft Speech Corpus(印度语言)发行版包含泰卢固语、泰米尔语和古吉拉特语的会话和短语语音训练和测试数据

2020-06-23 (3月前) 免积分下载
说话人深度识别数据集(VoxCeleb2)

说话人深度识别数据集(VoxCeleb2)

VoxCeleb2
2409

VoxCeleb是一个视听数据集,由从上传到YouTube的采访视频中提取的人类语音短片组成。

2019-06-30 (14月前) 免积分下载
TIMIT 语料库

TIMIT 语料库

The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus
1378 826MB

TIMIT数据集的语音采样频率为16kHz,共包含6300个句子,由来自美国八个主要方言地区的630人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。

2019-09-17 (12月前) 免积分下载
Warblr众包语音数据集

Warblr众包语音数据集

Warblr
404 4.3 Gb

来自英国各地的10,000个10秒的智能手机音频录音,音频总计持续44小时。音频将由Warblr根据知识共享许可发布。音频涵盖英国广泛的位置和环境,包括天气噪音,交通噪音,人类语音甚至人类鸟类模仿。

2020-05-01 (5月前) 免积分下载
AISHELL-翻译机录制语音数据库

AISHELL-翻译机录制语音数据库

AISHELL2019C-EVAL
965 4GB

来自AISHELL的开源语音数据产品:翻译机录制语音数据库

2019-08-02 (13月前) 免积分下载
AISHELL-语音唤醒词数据库

AISHELL-语音唤醒词数据库

AISHELL-2019B-EVAL
1714 25.05GB

来自希尔贝壳的语音唤醒词数据库

2019-08-02 (13月前) 免积分下载
阿拉伯自然音频数据集

阿拉伯自然音频数据集

Arabic Natural Audio Dataset
307 500MB

这是第一个用于识别3种离散情感的阿拉伯自然音频数据集(ANAD):快乐,愤怒和惊讶。

2020-04-07 (5月前) 免积分下载
大规模英语语料库(LibriSpeech)

大规模英语语料库(LibriSpeech)

LibriSpeech ASR corpus
4208 60 GB

公开数据集中最常用的英文语料,其中包含了1000小时的16kHz有声书录音,并且经过切割和整理成每条10秒左右的、经过文本标注的音频文件,非常适合入门使用。

2019-06-30 (14月前) 免积分下载
大型说话人识别数据集(VoxCeleb1)

大型说话人识别数据集(VoxCeleb1)

VoxCeleb1
3703

VoxCeleb是一个视听数据集,由从上传到YouTube的采访视频中提取的人类语音短片组成。

2019-06-30 (14月前) 免积分下载
人类语音的大规模视听数据集 (VoxCeleb)

人类语音的大规模视听数据集 (VoxCeleb)

VoxCeleb
3003

VoxCeleb, 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。

2019-06-30 (14月前) 免积分下载
爱数智慧日语手机朗读数据库

爱数智慧日语手机朗读数据库

Japanese Read Speech Recognition Corpus
736 2.4GB

本语料库的录制文本为日常用语。采集方式为手机录音;录音输出为PCM格式。37名来自日本不同区域(如东京、大阪、北海道等)的发言人参与采集。

2019-10-02 (11月前) 免积分下载
音频档案研究数据集

音频档案研究数据集

freefield1010
348

包含7690个音频剪辑的数据集,这些数据是从Freesound音频档案库中的字段记录标签中采样的

2020-04-07 (5月前) 免积分下载
共 2 页,当前第 1 页。