双峰分布的轻量级测试?

信息处理 统计数据 直方图
2022-02-01 04:34:15

在这里,以及在 stats stackexchange 中,似乎是对涉及迭代分箱或迭代曲线拟合方法的双峰分布的参考测试的答案。然而,“目测”数据集的图通常显示出明显的双峰(比如两个清晰模式峰值之间的 10 dB 下降或几个标准偏差等),而不是单个“驼峰”,或者一些模棱两可的东西(小于 3分贝下降)。

是否有任何轻量级算法(计算效率高、单次通过或确定性低迭代计数测试)可以分离出简单的情况(明显是单峰或明显双峰),而数据集可能需要更多计算密集型测试来测试多重或双模?

或者,在信号处理方面,如何以非图形方式快速测试噪声频谱图中的某个区域是否更有可能包含 2 音 FSK(具有未知的分离),而不是噪声或某种其他类型的调制信号?

2个回答

一种简单的方法,尤其是用于检测和估计噪声信号中 PSK 信号的 SNR 方法,是基于接收幅度的随机矩:

峰度可以用来衡量对称分布有多少“居中”。

您可以在频谱图中逐个计算样本峰度频率;那些具有高curtosis的bin可能不仅仅包含高斯噪声。

在为检测 2-FSK 优化的算法的稍微更精细的版本中,您可以使用它来识别“候选箱”,减去它们的平均功率以使平均变量为零,然后计算这些对的协方差(即计算协方差矩阵)。您正在寻找一个强大的负协方差 - 每当一个 bin 的功率高于平均水平时,另一个 bin 的功率就低。

如果测试只是为了测试有噪声的假设与有噪声加上一些双峰信号的假设,那么我会比较信号的平均绝对值,或者一些高阶偶矩(即 4、6或 8) 与它的标准偏差(假设它是零均值)。

对于高 SNR,这应该给出一个非常明显的预测,而不需要分箱。

(请注意——当你建立一个直方图并对其进行分析时,就会发生“双峰分布的眼球” 。这正是5 亿年进化赋予我们与生俱来的视觉的那种模式匹配看起来很容易和自动的处理,因为它是无意识的)。