信息处理 - 估计噪声中音调爆发的开始时间？ - 吾爱随笔录

估计噪声中音调爆发的开始时间？

信息处理声音的算法边缘检测

2022-01-03 06:02:33

可以使用哪些技术来估计噪声信号中正弦音突发的开始时间？

假设音调突发具有已知的固定频率（但未知相位）和非常陡峭的上升时间，并且目标是在优于一半的上升时间和/或音调频率的一个周期内估计开始时间，如果可能的话。如果信噪比非常低（远小于 1），估计技术会如何变化？

补充：假设音调的长度未知，但比上升时间和频率周期的小倍长。

补充：DFT/FFT 显示音调很可能存在。问题在于准确地确定 FFT 窗口中音调（或者可能是相同频率的多个音调突发）可能在 FFT 窗口内开始的位置，或者确定当前音调是否在该 DFT 窗口之外开始，前提是我拥有所有这些额外的时域数据。

雷达脉冲检测精度更接近我需要的分辨率，除了我只有一个边缘，因为音调的长度未知，而且除了已知的上升时间之外，它是未调制的。窄带通滤波器会扭曲上升时间，从而扼杀边缘到达估计分辨率。

1个回答

正如我们在评论中讨论的那样，Goertzel 算法是检测噪声音调的常用方法。讨论之后，我不确定它是否完全符合您的要求（您想要开始时间），但是对于如何将 Goertzel 算法应用于您的问题似乎存在混淆，所以我想我会写下来这里。

格策尔算法

如果您知道要查找的音调的频率（称之为 $f_g$ )，如果您对噪声水平有一个合理的了解，以便您可以选择合适的检测阈值。

可以认为 Goertzel 算法总是计算 ONE FFT bin 的输出：

y (n) = e^{ȷ 2 π f_{g} n} \sum_{k = 0}^{n} x (n) e^{- ȷ 2 π f_{g} k}

$y(n) = e^{\jmath 2\pi f_g n} \sum_{k=0}^n x(n) e^{-\jmath 2\pi f_g k}$

在哪里 $f_g$ 是您正在寻找的频率。

维基百科页面有更好的计算方法。

这是Scilab实施它的一个（微弱的）尝试：

function [y,resultr,resulti] = goertzel(f_goertzel,x)
realW = 2.0*cos(2.0*%pi*f_goertzel);
imagW = sin(2.0*%pi*f_goertzel);

d1 = 0;
d2 = 0;

for n = 0:length(x)-1,
    y(n+1) = x(n+1) + realW*d1 - d2;
    d2 = d1;
    d1 = y(n+1);
    resultr(n+1) = 0.5*realW*d1 - d2;
    resulti(n+1) = imagW*d1;
end
endfunction

考虑信号 $f = 0.0239074$ 和 $\phi = 4.4318752$ ：

x = \sin (2 π f n + ϕ) + ϵ (n)

$x = \sin(2\pi fn + \phi) + \epsilon(n)$

在哪里 $\epsilon(n)$ 是零均值、单位方差的高斯白噪声。

在此示例中，音调从索引 1001 处信号的三分之一处开始。

如果我们在其上运行 Goertzel 算法 $f_g = f - 0.001$ 然后我们得到图形的顶部两条迹线。

如果我们在其上运行 Goertzel 算法 $f_g = f$ 然后我们得到图形底部的两条痕迹。

这四个痕迹是：

$x$ （蓝色）和 $y$ （红色）为 $f_g = 0.0229074$
所结果的 $\sqrt{resultr^2 + resulti^2}$
$x$ （蓝色）和 $y$ （红色）为 $f_g = 0.0239074$
所结果的 $\sqrt{resultr^2 + resulti^2}$ （实线）和第一个结果（虚线）。

如您所见，我们感兴趣的音调出现在大约 250 处的峰值。如果我们将检测阈值设置为该值的一半左右（125），那么就会发生检测（平方根值大于 125 ) 在音调开始后大约索引 1450 --- 450 个样本。

这个阈值 (125) 在其他情况下不会导致检测（无论如何，对于这次运行），但是该输出的最大值是 115.24，我们不能过多地降低阈值而不会得到错误检测。

将阈值降低到 116 将导致在索引 1401 处检测到真实情况（对于本次运行）......但我们冒着更多误报的风险。

在此处输入图像描述

其它你可能感兴趣的问题

上一篇点云中的轮廓匹配下一篇如何提高最小均方 (LMS) / NLMS 过滤器性能？