我试图了解 PCA 在最近一篇题为“使用集群计算大规模映射大脑活动”的期刊文章中的使用,Freeman 等人,2014 年(实验室网站上提供免费 pdf文件)。他们在时间序列数据上使用 PCA,并使用 PCA 权重创建大脑地图。
数据是试验平均成像数据,存储为一个矩阵(在论文中称为),具有个体素(或大脑中的成像位置)个时间点(单个对大脑的刺激)。
他们使用 SVD 得到(表示矩阵的转置)。
作者指出
主成分(的列)是长度为的向量,分数(的列)是长度为(体素数)的向量,描述了每个体素在方向上的投影由相应的分量给出,形成体积上的投影,即全脑图。
所以 PC 是长度为的向量。我如何解释 PCA 教程中通常表达的“第一主成分解释了最大的方差”?我们从许多高度相关的时间序列矩阵开始——单个 PC 时间序列如何解释原始矩阵中的方差?我理解整个“高斯点云到最可变轴的旋转”的事情,但我不确定这与时间序列有何关系。当作者说:“分数(的列)是长度为的向量时,作者的方向是什么意思?(体素数),描述每个体素在相应分量给出的方向上的投影”?主分量时间过程怎么会有方向?
要查看从主成分 1 和 2 的线性组合以及相关脑图得到的时间序列示例,请转到以下链接并将鼠标悬停在 XY 图中的点上。
我的第二个问题与他们使用主成分分数创建的(状态空间)轨迹有关。
这些是通过获取前 2 个分数(在我上面概述的“光学”示例的情况下)并通过以下等式将单个试验(用于创建上述试验平均矩阵)投影到主子空间中创建的:
正如您从链接的电影中看到的那样,状态空间中的每条轨迹都代表了整个大脑的活动。
与关联前 2 台 PC 分数的 XY 图的图相比,有人可以提供关于状态空间电影的每个“帧”含义的直觉。在给定的“框架”上,1 次试验处于 XY 状态空间中的 1 个位置,而另一次试验处于另一个位置,这意味着什么?电影中的 XY 绘图位置与我的问题第一部分中提到的链接图中的主成分轨迹有何关系?