排序方式:默认,数量:21
微软Frames帧数据集

微软Frames帧数据集

Frames Dataset
105 71MB

Frames正是为了鼓励对对话代理的研究,这些代理可以支持复杂环境中的决策,在这种情况下,预订假期包括航班和酒店。

2020-06-23 (2月前) 免积分下载
MS-微软语音语料库(印度语)

MS-微软语音语料库(印度语)

Microsoft Speech Corpus (Indian languages)
111

Microsoft Speech Corpus(印度语言)发行版包含泰卢固语、泰米尔语和古吉拉特语的会话和短语语音训练和测试数据

2020-06-23 (2月前) 免积分下载
微软信息搜索对话(MISC)数据集

微软信息搜索对话(MISC)数据集

Microsoft Information-Seeking Conversation (MISC) dataset
86

MISC包括音频和视频信号;谈话记录;情感和生理信号;搜索记录和其他计算机使用情况;以及关于情绪,成功和努力的任务后调查。

2020-06-23 (2月前) 免积分下载
Microsoft语音语言翻译(MSLT)语料库

Microsoft语音语言翻译(MSLT)语料库

Microsoft Speech Language Translation (MSLT) Corpus
85

包含Microsoft Research收集的英语,中文和日语的会话,双语语音测试和调音数据。该软件包包括音频数据,成绩单和翻译,并允许在真实数据上对口语翻译系统进行端到端测试。

2020-06-23 (2月前) 免积分下载
Warblr众包语音数据集

Warblr众包语音数据集

Warblr
305 4.3 Gb

来自英国各地的10,000个10秒的智能手机音频录音,音频总计持续44小时。音频将由Warblr根据知识共享许可发布。音频涵盖英国广泛的位置和环境,包括天气噪音,交通噪音,人类语音甚至人类鸟类模仿。

2020-05-01 (3月前) 免积分下载
音频档案研究数据集

音频档案研究数据集

freefield1010
283

包含7690个音频剪辑的数据集,这些数据是从Freesound音频档案库中的字段记录标签中采样的

2020-04-07 (4月前) 免积分下载
阿拉伯自然音频数据集

阿拉伯自然音频数据集

Arabic Natural Audio Dataset
252 500MB

这是第一个用于识别3种离散情感的阿拉伯自然音频数据集(ANAD):快乐,愤怒和惊讶。

2020-04-07 (4月前) 免积分下载
固有唤醒词数据库 HI-MIA

固有唤醒词数据库 HI-MIA

HI-MIA
717 45.8GB

HI-MIA,是一个智能家居场景下的固有唤醒词数据库。该数据库共包含340个说话人,每个说话人语料包含了近场麦克风拾音和远场麦克风阵列的多通道拾音。它可用于声纹识别、语音唤醒识别等研究。

2019-12-12 (8月前) 免积分下载
爱数智慧日语手机朗读数据库

爱数智慧日语手机朗读数据库

Japanese Read Speech Recognition Corpus
679 2.4GB

本语料库的录制文本为日常用语。采集方式为手机录音;录音输出为PCM格式。37名来自日本不同区域(如东京、大阪、北海道等)的发言人参与采集。

2019-10-02 (10月前) 免积分下载
TIMIT 语料库

TIMIT 语料库

The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus
1215 826MB

TIMIT数据集的语音采样频率为16kHz,共包含6300个句子,由来自美国八个主要方言地区的630人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。

2019-09-17 (11月前) 免积分下载
AISHELL-语音唤醒词数据库

AISHELL-语音唤醒词数据库

AISHELL-2019B-EVAL
1565 25.05GB

来自希尔贝壳的语音唤醒词数据库

2019-08-02 (12月前) 免积分下载
AISHELL-家居环境近远讲同步语音数据库

AISHELL-家居环境近远讲同步语音数据库

AISHELL-2019A-EVAL
763 2.9GB

AISHELL-2019A-EVAL 是 AISHELL-ASR0010 的子库,共 24.3 小时。

2019-08-02 (12月前) 免积分下载
共 2 页,当前第 1 页。