这是一个关于分类的问题。我是一名神经科学专业的学生,对分类方法几乎没有经验,我将不胜感激有关在此数据上实现线性分类器 (LDA) 的最佳方法的任何建议。
我有一个脑磁图数据集,在人们执行认知任务时记录下来。这具有以下属性:
306 个数据通道,但预处理步骤已将维度减少到 64,然后将数据重新投影到传感器上。
数据在时域(1000Hz)中是细粒度的
数据被分成称为“试验”的短片段。这些对应于受试者正在执行的认知任务。试验可能会有所不同,例如,在 A 型试验(我将有约 50 个)中,受试者可能被要求注意空间左侧的刺激,而在 B 型试验(我有也 50)注意空间右侧的刺激)。
我想在试验中的特定时间点对我的数据进行分类(例如,在受试者被告知左/右参加后 0.5 秒),训练分类器区分 A 型和 B 型试验。每个观察的特征向量(即试验)是该时间点每个传感器的瞬时活动向量。我有比试验更多的功能(306 个传感器),所以我要么需要进行特征选择,要么使用正则化 LDA(或者使用 Hastie 的稀疏判别分析之类的东西,在我看来两者都做)。
我可以这样做,但似乎它丢弃了有关数据点中包含的数据的统计结构的信息,而不是我尝试分类的确切时间。此外,我知道数据的维数低于 306 - 少于 50 个组件可能会捕获数据中的绝大多数方差。
因此,我正在考虑使用降维步骤,可能是 PCA,然后将降维数据传递给非正则化 LDA 或朴素贝叶斯分类器。 这个想法是,降维步骤利用了我有大量数据随时间采样的事实。
这就是我感到困惑的地方。PCA 将数据投影到正交维度上,那么进行 LDA(它估计协方差矩阵以使用有关特征之间相关性的信息)是否有意义?或者我应该在降维之后做朴素贝叶斯?在这种情况下,我可能刚开始做朴素贝叶斯,因为它对 LDA 方式的特征数量不敏感。
鉴于这些数据的特定结构,如果有人可以在这里提出一个好的方法,我将不胜感激。关键问题是:PCA 后跟 LDA 有意义吗?