信息处理 - VAD 语音语料库 - 吾爱随笔录

VAD 语音语料库

信息处理 DSP核心语音识别语音处理演讲

2022-02-02 05:55:00

我正在做一个与 VAD 相关的学生研究项目。我想找到增加噪音的语音语料库。我发现了很多关于 NIST Speaker Recognition Corpora 的参考资料。但不幸的是，主站点上的所有链接都已经失效。

也许有人有这个语料库？或者有人可以推荐一个有噪音的好语料库？

3个回答

查看 Kaldi 人的 MUSAN 语料库（Dan Povey 等人）：

MUSAN 是一个新的音乐、语音和噪音语料库。该数据集适用于语音活动检测 (VAD) 和音乐/语音识别的训练模型。我们的语料库是在灵活的知识共享许可下发布的。该数据集包括来自多种流派的音乐、来自十二种语言的语音以及各种各样的技术和非技术噪音。我们展示了使用该语料库对广播新闻进行音乐/语音识别，并使用 VAD 进行说话人识别。