这是来自交叉验证堆栈交换的交叉发布,因为我认为这可能是一个更好的论坛。
我有一个数据集,由从不同患者组获得的不同长度的呼吸时间序列信号组成。我想通过使用每组时间序列的共性来使用这些时间序列对患者进行分类或聚类。但是,我没有dsp的经验。
首先,如果我应该过滤我的信号以去除任何高于奈奎斯特频率的频率,我会感到困惑。我的采样频率是 32Hz,我的时间序列有些嘈杂并且有一些伪影。我也不确定为此选择哪个过滤器。
其次,我想查看一组内每个频率的周期图和平均功率谱密度 - 但我不确定我是否非常了解周期图 - 如果我有不同的时间序列长度,那么我的周期图长度也会有所不同,所以我不确定如何进行这种比较。
来自纯数学,我纯粹从函数的角度了解傅里叶分析,并使用傅里叶变换来获得描述这些函数在正交系统上的投影的系数。然而,对于周期图,我注意到 x 轴代表样本频率。我对采样频率与生成函数的基本频率之间的区别感到困惑(比如我有以 10Hz 采样,周期图是否表征了函数的 1Hz 基本频率?)
任何有关如何从机器学习的角度分析和消除时间信号的噪声分量的资源将不胜感激!由于时间限制,我避开了关于数字信号处理的长篇教科书。非常感谢。