如何检测 wav 文件中的点击/滴答声?

信息处理 过滤器 傅里叶变换 互相关
2022-02-23 07:26:19

我有一段火车的长录音(这里是一个小样本),当车轮越过轨道的连接处时,会发出许多咔哒声。我想检测这些的位置。

看波形: 在此处输入图像描述

似乎有 8-10 次点击。有些是靠得很近的。

我可以看到它们显示为持续高振幅的区域。是否有一个过滤器可以将其与可以将它们相互关联的过滤器或者是否有另一种更好的方法?

1个回答

使用起始检测器 - Duxbury 的论文“基于相位和幅度组合的音频分割起始检测方法”中描述了一种经典方法。如果您想要一个现成的解决方案,您可以使用Sonic Visualizer / Sonic annotator,它可以将起始位置导出为文本文件。

它适用于您的示例,只有一个误报 - 通过在起始检测检测函数(第二条曲线)值上添加额外的阈值可以轻松丢弃。

在此处输入图像描述