如何解释时间序列数据的 PCA?

机器算法验证 时间序列 主成分分析 状态空间模型 神经影像学 神经科学
2022-02-14 07:21:16

我试图了解 PCA 在最近一篇题为“使用集群计算大规模映射大脑活动”的期刊文章中的使用,Freeman 等人,2014 年(实验室网站上提供免费 pdf文件)。他们在时间序列数据上使用 PCA,并使用 PCA 权重创建大脑地图。

数据是试验平均成像数据,存储为一个矩阵(在论文中称为),具有个体素(或大脑中的成像位置)个时间点(单个对大脑的刺激)。Y^n×t^

他们使用 SVD 得到表示矩阵的转置)。

Y^=USV
VV

作者指出

主成分(的列)是长度为的向量,分数(的列)是长度为(体素数)的向量,描述了每个体素在方向上的投影由相应的分量给出,形成体积上的投影,即全脑图。Vt^Un

所以 PC 是长度为的向量。我如何解释 PCA 教程中通常表达的“第一主成分解释了最大的方差”?我们从许多高度相关的时间序列矩阵开始——单个 PC 时间序列如何解释原始矩阵中的方差?我理解整个“高斯点云到最可变轴的旋转”的事情,但我不确定这与时间序列有何关系。当作者说:“分数(的列)是长度为的向量时,作者的方向是什么意思?t^Un(体素数),描述每个体素在相应分量给出的方向上的投影”?主分量时间过程怎么会有方向?

要查看从主成分 1 和 2 的线性组合以及相关脑图得到的时间序列示例,请转到以下链接并将鼠标悬停在 XY 图中的点上。

弗里曼等人。

我的第二个问题他们使用主成分分数创建的(状态空间)轨迹有关。

这些是通过获取前 2 个分数(在我上面概述的“光学”示例的情况下)并通过以下等式将单个试验(用于创建上述试验平均矩阵)投影到主子空间中创建的:

J=UY.

正如您从链接的电影中看到的那样,状态空间中的每条轨迹都代表了整个大脑的活动。

与关联前 2 台 PC 分数的 XY 图的图相比,有人可以提供关于状态空间电影的每个“帧”含义的直觉。在给定的“框架”上,1 次试验处于 XY 状态空间中的 1 个位置,而另一次试验处于另一个位置,这意味着什么?电影中的 XY 绘图位置与我的问题第一部分中提到的链接图中的主成分轨迹有何关系?

弗里曼等人。

2个回答

Q1:PC时间序列和“最大方差”有什么联系?

他们正在分析的神经元中每个个数据点,因此可以将其视为维空间个数据点它是“点云”,因此执行 PCA 等于找到最大方差的方向,正如您所知道的。我更喜欢将这些方向(它们是协方差矩阵的特征向量)称为“主轴”,并将数据在这些方向上的投影称为“主成分”。t^nt^nRn

在分析时间序列时,对这张图片的唯一补充是点是有意义的排序或编号(从),而不是简单的点的无序集合这意味着如果我们采用单个神经元的放电率(这是中的一个坐标),那么它的值可以绘制为时间的函数。类似地,如果我们取一台 PC(它是从在某行上的投影),那么它也有值并且可以绘制为时间的函数。因此,如果原始特征是时间序列,那么 PC 也是时间序列。1t^RnRnt^

我同意@Nestor 的上述解释:每个原始特征都可以看作是 PC 的线性组合,并且由于 PC 彼此之间不相关,因此可以将它们视为原始特征分解成的基函数。这有点像傅立叶分析,但我们不是采用正弦和余弦的固定基,而是为这个特定数据集找到“最合适”的基,从某种意义上说,第一台 PC 占最大方差等。

这里的“考虑最大方差”意味着如果您只采用一个基函数(时间序列)并尝试用它来近似您的所有特征,那么第一台 PC 将做得最好。所以这里的基本直觉是第一台 PC 是一个基函数时间序列,它最适合所有可用的时间序列,等等。


为什么弗里曼等人的这段话。这么混乱?

弗里曼等人。分析数据矩阵,变量(即神经元)在行(!)中,而不是在列中。请注意,它们减去行均值,这是有道理的,因为变量通常在 PCA 之前居中。然后他们执行 SVD:使用我上面提倡的术语,的列是主轴(在中的方向),的列是主成分(长度为的时间序列)。Y^

Y^=USV.
URnSVt^

你从弗里曼等人引用的句子。确实很混乱:

主成分(的列)是长度为的向量,分数(的列)是长度为(体素数)的向量,描述了每个体素在方向上的投影由相应的分量给出,形成体积上的投影,即全脑图。Vt^Un

首先,的列不是 PC,而是缩放到单位范数的 PC。其次,的列不是分数,因为“分数”通常表示 PC。第三,“相应组件给出的方向”是一个神秘的概念。认为他们在这里翻转图片并建议考虑个点,这样现在每个神经元都是一个数据点(而不是一个变量)。从概念上讲,这听起来像是一个巨大的变化,但在数学上几乎没有什么区别,唯一的变化是主轴和 [unit-norm] 主成分改变了位置。在这种情况下,我上面的 PC( -long time series)将成为主轴,即VUnt^t^方向,并且可以被认为是这些方向上的归一化投影(归一化分数?)。U

我觉得这很令人困惑,所以我建议忽略他们对单词的选择,而只看公式。从这一点开始,我将继续使用我喜欢的术语,而不是 Freeman 等人的方式。使用它们。


Q2:状态空间轨迹是什么?

他们获取单次试验数据并将其投影到前两个主轴上,即的前两列。如果您使用原始数据进行此操作,您将获得两个第一主成分。同样,一个主轴上的投影是一个主成分,即一个 -long 时间序列。UY^t^

如果你用一些单次试验数据来做,你又会得到两个 -long 时间序列。在电影中,每一行都对应着这样的投影:x坐标根据PC1演变,y坐标根据PC2演变。这就是所谓的“状态空间”:PC1 针对 PC2 绘制。时间随着圆点的移动而流逝。Yt^

电影中的每一行都是通过不同的单次试验获得的。Y

关于第一个问题。将通过特定体素的整个时间序列视为来自多元分布的单个抽取。我们现在可以将其视为一个多元向量,就像我们可能应用 PCA 的任何其他向量一样。的前列是特征时间过程,当线性组合时,它们在刺激内提供了通过特定体素的时间过程的最佳近似值。pVt^

所以是一个矩阵,因此Y^n×t^Un×nVt^×t^

关于第二个问题。给出的方程是

J=UTY

给定是一个 2 或 3矩阵。(这涉及删除行/列的小技巧。)选择两个或三个作为维度,因为这可以在论文的图 6 中绘制。J×t

然而 切割成与刺激呈现相对应的不同部分来获得单独的迹线(图 6 中的线) 。然后可以通过将每一列视为该空间中的一个点,然后在相邻列定义的点之间绘制一条线,从而在 2 或 3 维空间中绘制这些块中的每一个,从而给出轨迹。tt^J

从上面的视频开始,每个块出现 8 以顺序添加每个(列)点,将其连接到最后一个点,并将此长度序列渲染为视频。t^

我以前没有处理过着色方法,我需要一段时间才能有信心对这方面发表评论。我发现关于与图 4c 相似性的评论令人困惑,因为着色是通过每体素回归获得的。而在图 6 中,每条迹线都是整个图像的伪像。除非我直截了当地说,否则我认为这是该时间段内刺激的方向,如图中的注释所示。