数据挖掘 - 为什么在收集语音数据时前后沉默很重要？ - 吾爱随笔录

数据挖掘机器学习数据集机器学习模型音频识别

2022-02-10 22:53:00

我一直在想，为什么在为 AI 机器学习收集语音数据时，为语音数据收集静音前和静音后很重要？机器是否只是为了学习和理解“沉默”、“背景噪音”和实际“语音”之间的区别？

1个回答

在将原始数据分割成适当大小的样本以用于机器学习方法时，静默通常很有用。一次运行几分钟录制是可行的，但机器学习模型的输入通常应该是例如 1 秒剪辑。每个剪辑都应避免中途剪切一个单词。静音允许使用简单的阈值算法来分割单词或短语。

其它你可能感兴趣的问题