在进行测试时,我将做很多录音。问题是我想从我的录音中轻松提取一些部分。有没有办法播放一些特殊的声音序列,例如几声哔哔声,然后在整个录音中搜索这些标记?
最后,我想获得带有标签段的文件,类似于 Audacity 正在做的事情。到现在为止,我一直在用拍手并在长时间记录的信号中寻找能量峰值。因为我正在用起动手枪测量房间,所以这不是一个好主意。稍后这将使我能够非常快速和轻松地分析以搜索相似的声音组。例如:
开始时间、结束时间、地点
100, 399, 位置 1
500、600、位置 2
我尝试用某种模式计算相关性,但是当房间混响时,它的表现不是很好。我从阈值相关中得到了一些错误的标记。这是因为标记被涂抹而不准确。
该任务的最佳方法和信号类型是什么?任何好的和快速的技术,比如匹配过滤?
附录:
简单地说我想要的:
随机播放标记声音/模式
- 记录这个信号和其他信号
在很长的录音中搜索这些录音模式
能够说出这些模式在哪个时间点是例如互相关(不能很好地工作)可能会产生我可以搜索的尖峰
它应该能够防止噪音、音调/脉冲声音、混响和低播放电平
它不应该很慢。例如在 10 分钟文件 40 秒是我的上限