PCA 之于 CCA 就像 ICA 之于?

机器算法验证 主成分分析 典型相关 独立成分分析
2022-03-29 04:05:51

PCA 在数据中寻找使解释方差最大化的因素。据我所知,典型相关分析 (CCA) 类似于 PCA,但它寻找的因素是最大化两个数据集之间的互协方差。因此,找到两个数据集共有的类似 pca 的因子。

独立成分分析 (ICA) 类似于 PCA,但它寻找统计上独立的因素。在某种程度上,这导致了更多可解释的因素。例如基因通路、大脑网络、面部的一部分。或者你可以说它会识别混合产生数据的独立来源。

有没有一种类似于 ICA 的方法,就像 PCA 与 CCA 一样?那么这会找到两个数据集共有的独立组件吗?结果真的有意义吗?

1个回答

ICA 的第一步是使用 PCA 并将数据集投影到低维潜在空间中。第二步是在潜在空间内执行坐标更改,选择该更改以优化非高斯性度量。这往往会导致系数和载荷即使不是稀疏的,也至少集中在少量的观察和特征中,这样就有助于解释。

同样,在这篇关于 CCA+ICA 的论文中(Sui 等人,“基于 CCA+ICA 的多任务脑成像数据融合模型及其在精神分裂症中的应用”),第一步(见脚注)是执行 CCA,这会产生每个数据集到低维空间的投影。如果输入数据集是X1X2, 每个都有Nrows=observations,然后 CCA 产生Z1=X1W1Z2=X2W2在哪里Y的也有N行=观察。请注意,Y有少量列,在Y1Y2,与X的,甚至可能没有相同数量的列。然后,作者应用了与 ICA 中相同的坐标变化策略,但他们将其应用于级联矩阵[Z1|Z2].

脚注:作者还使用了涉及 PCA 的预处理步骤,我在此忽略。它们是论文特定领域分析选择的一部分,而不是 CCA+ICA 方法的必要条件。