固有唤醒词数据库 HI-MIA

HI-MIA

AISHELL 语音数据集唤醒词语料

HI-MIA，是一个智能家居场景下的固有唤醒词数据库。该数据库共包含340个说话人，每个说话人语料包含了近场麦克风拾音和远场麦克风阵列的多通道拾音。它可用于声纹识别、语音唤醒识别等研究。

下载所需积分：免积分下载

数据集发布者：数据集市

发布时间： 2019年12月12日

数据大小： 45.8GB

查看原始数据

相关数据

MS-微软语音语料库（印度语）

Microsoft Speech Corpus（印度语言）发... 免积分下载

VoxForge 语音库

VoxForge 创建的初衷是为免费和开源的语音识别引擎收集... 免积分下载

说话人深度识别数据集（VoxCeleb2）

VoxCeleb是一个视听数据集，由从上传到YouTube的... 免积分下载

数据详情
文件信息

数据介绍

该数据用于2019年AISHELL演讲者验证挑战赛。它是从一个名为AISHELL-WakeUp-1的较大数据库中提取的。

HI-MIA，是一个智能家居场景下的固有唤醒词数据库。该数据库共包含340个说话人，每个说话人语料包含了近场麦克风拾音和远场麦克风阵列的多通道拾音。它可用于声纹识别、语音唤醒识别等研究。整个数据集分为训练集（254人），开发集（42人）和测试集（44人）。测试子集提供了成对的目标/非目标答案，以评估验证结果。

您可以使用以下BibTeX条目引用数据： @misc{himia, title=, author=, year={2019}, eprint={1912.01231}, archivePrefix=, primaryClass= }

wakeup_data 数据集链接： http://aishelltech.com/wakeup_data

数据规格

数据来源	AISHELL演讲者验证挑战赛
发布时间	2019年

还没有任何文件记录.