帮助降噪信号和周期图分析资源

信息处理 信号分析 功率谱密度 机器学习 去噪 时间序列
2022-02-07 22:13:44

这是来自交叉验证堆栈交换的交叉发布,因为我认为这可能是一个更好的论坛。

我有一个数据集,由从不同患者组获得的不同长度的呼吸时间序列信号组成。我想通过使用每组时间序列的共性来使用这些时间序列对患者进行分类或聚类。但是,我没有dsp的经验。

  1. 首先,如果我应该过滤我的信号以去除任何高于奈奎斯特频率的频率,我会感到困惑。我的采样频率是 32Hz,我的时间序列有些嘈杂并且有一些伪影。我也不确定为此选择哪个过滤器。

  2. 其次,我想查看一组内每个频率的周期图和平均功率谱密度 - 但我不确定我是否非常了解周期图 - 如果我有不同的时间序列长度,那么我的周期图长度也会有所不同,所以我不确定如何进行这种比较。

来自纯数学,我纯粹从函数的角度了解傅里叶分析,并使用傅里叶变换来获得描述这些函数在正交系统上的投影的系数。然而,对于周期图,我注意到 x 轴代表样本频率。我对采样频率与生成函数的基本频率之间的区别感到困惑(比如我有以 10Hz 采样,周期图是否表征了函数的 1Hz 基本频率?)sin(2πx)

任何有关如何从机器学习的角度分析和消除时间信号的噪声分量的资源将不胜感激!由于时间限制,我避开了关于数字信号处理的长篇教科书。非常感谢。

2个回答

首先,如果我应该过滤我的信号以去除任何高于奈奎斯特频率的频率,我会感到困惑。我的采样频率是 32Hz,我的时间序列有些嘈杂并且有一些伪影。我也不确定为此选择哪个过滤器。

那艘船已经航行了。

,即具有幅度、频率和相位的所有不同复正弦曲线的集合。S={αei(ωt+φ)|α>0,0φ<2π,ωR}

那么是一个可交换半群(证明平凡)。(S,)

引入等价关系(“两个信号在采样率为后是相同的”),我们看到信号 if,即如果信号的频率相差采样率的倍数,我们无法在采样后区分信号。∼:aba(nr)=b(nr)nZrsl=αei(ωlt+φ),l=1,2,s1s2ω1ω22π=nr,nZ

让我们将其形式化:的商半群,即,并且每个elements 是一个等价类的领导者——这个同态实际上是采样,正如我们在上面看到的,它不是双射的。T={αei([ft+ϕ]mod2π)}STSST

的所有原始频率分量都映射到来自的某个分量,频率归一化为采样频率。该映射称为别名ST

抗混叠滤波器的作用是h

h(s):SS,h={s,f<fnyquist0else,

正如您在上面插入时会发现的那样,这只会产生没有混叠到不同频率的元素。h(s)

因此,“幸存”的所有事物也将“幸存”混叠,而不会发生频率变化。h

因此,如果您需要抗混叠滤波器,现在为时已晚。去重新做你的录音。

其次,我想查看一组内每个频率的周期图和平均功率谱密度 - 但我不确定我是否非常了解周期图 - 如果我有不同的时间序列长度,那么我的周期图长度也会有所不同,所以我不确定如何进行这种比较。

在这种情况下,周期图本身并不是一个有用的映射——例如,您需要添加诸如截断/填充操作之类的东西以使所有信号具有相同的持续时间。在这一点上,周期图似乎不再是一种明智的方法。

  1. 采样(离散时间)信号的傅里叶变换只能具有介于 -Fs/2 和 +Fs/2 之间的信息,并且该信息重复使得 X(f +Fs) = X(f),使得 Fs 是采样频率。这意味着在对模拟信号进行采样时,您可能希望对该信号进行低通以确保其没有高于 Fs/2(奈奎斯特频率)的频率。这必须在模拟信号上完成。如果模拟信号的频率确实高于奈奎斯特,它们将“混叠”,并且在采样后无能为力,除非您对信号有所了解,但这更像是一种极端情况。

  2. 周期图有长度和跳数。长度越长,频率分辨率越高,但时域带宽越低。跃点大小设置时域分辨率。因此,只要长度足够,您就可以使用 10Hz 的采样率解析 1Hz。

对不起,我不做任何机器学习的东西,所以帮不上忙。