使用时间序列数据进行分类的正确方法是什么?

数据挖掘 机器学习 分类 scikit-学习 时间序列 监督学习
2022-02-20 17:22:27

我有一个分类问题的时间序列数据集。数据包含通过 EEG 电极沿 2 秒的频率 (Hz) 收集的脑信号。这些类被划分在不同的文件中(因此每个文件只包含一个类)。这是一个典型的 BCI(脑机接口)分类问题,据我所知,这是分类分类的常用方法。

我想知道为分类器算法准备数据的正确方法,因为我没有常见的分类问题应该有的 X、Y 值,并且数据是时间相关的。欢迎任何解释/材料。

我也在考虑使用scikit-learn MLPClassifier

1个回答

欢迎来到社区!

嗯……答案需要解释一下。这与 MLPclassfier 或其他 python 函数无关。它是关于专门针对生物信号的信号处理/分析的背景。

对于 EEG 等不同的生物信号,长期以来一直在进行特征提取研究。例如,在您的问题中,BCI,您可能知道P300等常见功能(我已经过时了。您可能会查看最近的评论论文。)。因此,通常您从这些信号中提取特征并将它们用作分类器的输入(您提到的那些 X、Y 值)。我稍微解释一下:

一般来说

有从信号中提取的通用特征方法。它们要么从时域频域时频域的信号中提取。

查看这些链接并获得概述。

脑电图

但是对于特定的生物信号,您不需要重新发明轮子。EEg 信号分析方法的历史悠久特别是对于 BCI,还有一些评论可以帮助您找到好的特征提取分类方法

最后我的观点是,MLPclassifier 只是一个 python 函数。根据我作为最初来自生物医学数据分析的 ML 科学家的经验,问题更多是关于“做什么?” 在“怎么办?”之前。我希望它有所帮助。如果您有更多问题,请发表评论,以便我更新我的答案。

祝你好运!