我计划创建一个语音识别网络来识别几个单词(语音命令),并从谷歌遇到语音命令数据集。除了可用的数据集之外,我还计划添加更多的词,例如“移动”、“保存”等,它们不是谷歌数据集的一部分。
有没有一种方法或任何其他来源可以让我创建/查找单词的数据集?
由于许多在线数据集可用于句子和语音转录,我正在考虑编写一个脚本,该脚本可以通过可用的转录并找到所需单词的位置并物理裁剪音频,然后对其进行填充以制作一秒钟的音频文件. 但这似乎是一个非常非常艰巨的过程,像我的机器人的名字这样的几个字在网上不会出现。
各位大佬能推荐个方法吗?