如何量化通过过滤数字信号而丢失的信息量?

信息处理 信号分析 信号检测 自适应滤波器
2022-02-05 18:21:51

假设我正在使用 DTW 算法从一些传感器读数中提取特征。我想提取和编目一组特征。

在将信号发送到 DTW 提取器之前,我有几个工具可以从信号中去除我认为是噪声的东西。我可以使用带通/陷波滤波器或 DFT。

当以交互方式执行此操作时,作为人类,我很容易发现频谱的哪一部分是有趣的,哪一部分是低熵噪声。

例如,以下信号: 在此处输入图像描述

叠加了三个信号。

  • 低频方脉冲(400 个样本长 - 2.5mHz)
  • 中频正弦波(33 个样本长 - 30mHz)
  • 和高频噪声。

对我来说,这是微不足道的。我说可见,但如果我要听信号,这也是可听见的。

地面噪声恰好是无刷风扇偶尔启动时产生的射频干扰。所以我可以在那里或不在那里有噪音,这取决于一个完全随机的变量。

目前尚不清楚中频正弦波是否只是方波的叠加,还是由相同的基本潜在现象产生的。如果不是同一种现象,它们各自的相位就有可能发生漂移,方波信号的上升沿有时会与正弦波的上升沿对齐。这意味着对于最终成为方波信号的信号,我可以拥有数十种不同外观的 DTW 特征,而这是我宁愿避免的。


描述了上述情况后,我的问题如下:

  • 我可以使用什么指标(如果答案不是简单的,甚至可以使用理论或分析分支)来确定必要的过滤量?对于任何给定的 500 个样本的分析窗口,在尝试提取特征之前,我如何以编程方式确定如何预处理我的信号?
  • 给定具有特定光谱分布的样本窗口,是否存在带通滤波器的最佳截止值?(或陷波频率)
  • 如果有,它是否一直存在?
  • 如果存在最优值,我如何获得它?
  • 这与信号中的信息量有什么关系?

注意:我的问题含糊不清是我问题的一部分。我不知道从哪里开始寻找答案。

需要明确的是:我并没有试图获得比现有更多的信息。我想尽可能少地降低信号,同时消除明显的低熵噪声。

我研究过自适应滤波器之类的东西,但这些似乎经常有一个单独的测量来帮助反馈循环。

1个回答
  • 我可以使用什么指标(如果答案不是简单的,甚至可以使用理论或分析分支)来确定必要的过滤量?

您可以使用已有的东西,即分析产生的组件的“优势”。您可以按降序对系数进行排序,然后获得它们的累积和。最后,您可以设置阈值并在所选组件的累积强度(例如)超过 90% 时停止添加组件。这样,您将选择Nsc最强的分量和具有较高信噪比(或换句话说更接近某些背景噪声水平)的拒绝分量。如果这必须是一个低通滤波器,那么在你隔离第一个Nsc占总信号强度 90%(例如)的组件,那么您可以在具有最高频率(或 bin)的组件处设置低通滤波器截止频率。

  • 对于任何给定的 500 个样本的分析窗口,在尝试提取特征之前,我如何以编程方式确定如何预处理我的信号?

请参阅先前的答案,鉴于窗口长度(此处为 500 个样本)施加的频率(或比例)限制,您可能需要调整阈值和截止值。请注意,如果您尝试在每帧(每帧 500 个样本)应用上述算法,那么不可避免地,您将在帧之间获得某种调制,这取决于您的应用程序,您必须以某种方式进行管理。这是因为信号强度在 500 个样本的窗口之间会发生变化,这意味着低通滤波器的电位截止也会发生变化,这意味着每一帧将承受不同的滤波量。解决这个问题的最简单方法是增加窗口重叠(以更多帧为代价,因此需要更多计算)。

  • 给定具有特定光谱分布的样本窗口,是否存在带通滤波器的最佳截止值?(或陷波频率)

仅在有关噪声频谱分布的特定假设下。如果没有这个,您可以研究您的信号并尝试创建一个匹配的滤波器,该滤波器针对信号的频谱特性进行定制,因此任何外部信号都将被过滤掉。

  • 如果有,它是否一直存在?

请看之前的回答

  • 如果存在最优值,我如何获得它?

请看之前的回答

  • 这与信号中的信息量有什么关系?

这个“信息量”有点不清楚。信息具有特定含义,那么您指的是预期能够完全编码您的“干净”波形的位数吗?或者可能是由光谱得出的熵?还是光谱平坦度或者,您是在谈论如果将该脉冲序列视为通信信号(?)将携带的实际信息。作为一般性评论,低通滤波器会降低信号在其输出中的熵......但这是一个过于笼统的陈述,可能在您的上下文中有用(?)。

希望这可以帮助。如果有更多数据可用,很高兴修改回复。