为什么在收集语音数据时前后沉默很重要?

数据挖掘 机器学习 数据集 机器学习模型 音频识别
2022-02-10 22:53:00

我一直在想,为什么在为 AI 机器学习收集语音数据时,为语音数据收集静音前和静音后很重要?机器是否只是为了学习和理解“沉默”、“背景噪音”和实际“语音”之间的区别?

1个回答

在将原始数据分割成适当大小的样本以用于机器学习方法时,静默通常很有用。一次运行几分钟录制是可行的,但机器学习模型的输入通常应该是例如 1 秒剪辑。每个剪辑都应避免中途剪切一个单词。静音允许使用简单的阈值算法来分割单词或短语。