我创建了一个基于能量平均值比率的一维信号(例如音频)的基本分割算法。分类规则涉及比较在一个固定阈值下在一个较短时间窗口上测量的信号能量除以在较长时间窗口上测量的信号能量。
更准确地说,如果是指数处的瞬时信号功率,则上述量为:
我对这个非线性系统的行为很感兴趣,因为它在实践中似乎很有用。任何人都可以提出一种理论上分析它的方法吗?
我创建了一个基于能量平均值比率的一维信号(例如音频)的基本分割算法。分类规则涉及比较在一个固定阈值下在一个较短时间窗口上测量的信号能量除以在较长时间窗口上测量的信号能量。
更准确地说,如果是指数处的瞬时信号功率,则上述量为:
我对这个非线性系统的行为很感兴趣,因为它在实践中似乎很有用。任何人都可以提出一种理论上分析它的方法吗?
这在一定程度上取决于您想要得到我们的分析
第一步:瞬时功率
你把信号平方。这极大地改变了频谱。特别是您需要注意混叠。假设您的信号是以 48 kHz 采样的 15 kHz 正弦波。如果将其平方,您将获得一个 DC (0 Hz) 分量和另一个 30 kHz 分量。但是,30 kHz 分量将混叠到 18 kHz,因此在这种情况下,您的频谱平方是完全错误的。为了安全起见,您应该在平方之前对信号进行 2 倍的上采样,或者以采样率的四分之一对其进行低通滤波。许多“自然”音频信号在高频下没有很多能量,因此也可以选择只忍受混叠误差,但这是一个特定于应用程序的决定。
瞬时功率的物理解释很复杂。假设您的输入信号是扬声器端子处的电压:平方不代表瞬时功率。实际瞬时功率是电压和电流波形的乘积。由于扬声器是无功负载,这将与平方电压完全不同。例如,瞬时功率为负值是完全正常的,而信号的平方永远不会是负值。负瞬时功率简单意味着负载具有能量存储,并且有时它可以将存储的能量反馈回源。
回到正弦波示例。平方正弦在 DC 处创建一个分量,在两倍频率处创建一个分量。一种可能的解释:直流分量反映了实际消耗的功率,双频分量表示在电源和负载之间交换但未消耗的功率:它只是来回推动。
假设信号是“实际”瞬时功率,那么它的平均值将代表平均功率,积分将代表实际消耗的能量(精确)。
第 2 步:移动平均线
移动平均只是一个低通滤波器,其中平均窗口的长度决定了“截止”频率。不幸的是,这是一个相当可怜的。它会衰减频谱中的“较高”频率,但非常不均匀。我个人认为,在大多数情况下,一个简单的 IIR 滤波器会工作得更好。
低通滤波器将消除功率信号的“来回分量”,但保持“实际消耗”。截止频率(或时间常数)的选择应与您要观察的物理过程相关联。即可以是电源存储的时间常数或系统的热时间常数。
第 3 步:除以不同时间常数的平均值
这将创建“短期功率”与“长期功率”的比率,您可以通过低通滤波器的截止频率定义“短期”和“长期”。这是否有用取决于您的应用程序。这是一个相对指标:它显示了您的能源消耗有多“尖峰”。
由于实际瞬时功率可能为负,因此可以想象低通滤波版本也可能为负或为零,这会使除法产生问题。
这种技术类似于地震中的经典信号处理,是“第一断拾取”的目的。它是在Françoise Coppens,1985 年(我的前同事)中提出的关于自动估计静态校正的公共偏移迹线集合的首次到达选取。您可能会找到名称STA/LTA(短期平均/长期平均)。其他细节在第一次休息采摘的历史。
我提供此参考有两个原因:
有许多变化,例如使用不同的窗口大小,转换变量,例如使用幂。
我没有想到理论分析,但我可以查一下。我还建议投资于有关音频或音乐发病检测的文献,例如以下概述:
和变化检测。