HI-MIA,是一个智能家居场景下的固有唤醒词数据库。该数据库共包含340个说话人,每个说话人语料包含了近场麦克风拾音和远场麦克风阵列的多通道拾音。它可用于声纹识别、语音唤醒识别等研究。
该数据用于2019年AISHELL演讲者验证挑战赛。它是从一个名为AISHELL-WakeUp-1的较大数据库中提取的。
HI-MIA,是一个智能家居场景下的固有唤醒词数据库。该数据库共包含340个说话人,每个说话人语料包含了近场麦克风拾音和远场麦克风阵列的多通道拾音。它可用于声纹识别、语音唤醒识别等研究。 整个数据集分为训练集(254人),开发集(42人)和测试集(44人)。测试子集提供了成对的目标/非目标答案,以评估验证结果。
您可以使用以下BibTeX条目引用数据: @misc{himia, title=, author=, year={2019}, eprint={1912.01231}, archivePrefix=, primaryClass= }
wakeup_data 数据集链接: http://aishelltech.com/wakeup_data
数据来源 | AISHELL演讲者验证挑战赛 |
发布时间 | 2019年 |