Velicer 的最小平均部分 (MAP) 测试背后的直觉是什么?

机器算法验证 主成分分析 因子分析 偏相关
2022-04-03 13:42:35

在我的领域中,当研究人员考虑在因子分析中保留多少因子或在 PCA 中保留多少分量时,通常使用并行测试和 Velicer 的最小平均偏 (MAP) 测试。

我发现并行测试相当直观——我们想要比从随机数据派生的因子/分量解释更多方差的因子/分量。

据我了解,在 MAP 测试中,我们仅使用一个因子/分量进行 PCA/因子分析,然后将该 PC/因子从观察变量之间的相关性中剔除,然后我们计算平均平方偏相关系数偏相关矩阵的非对角线。然后我们用两个因素/组件重复这个过程,依此类推。然后我们寻找导致最低平均平方相关系数的因素/成分的数量。

在某种程度上,我认为我了解上述过程的机制,但我不明白它与选择适当数量的因素/主要成分有何关系。原始论文很短且可读性强,但我读后并没有感觉到我直观地理解了这个概念。

韦利瑟,WF (1976)。从偏相关矩阵中确定分量的数量。心理测量学,41(3),321-327。

1个回答

我认为可以通过查看部分相关公式来掌握 MAP 背后的直觉,该公式包含在 Velicer (1976) 论文(方程式 11)中,为方便起见,我也将其写在这里:

rij.y=rijriyrjy((1riy2)(1rjy2))1/2

在分子处,您有每对变量之间的部分协方差ij; 由于您正在消除系统方差,因此该数字会随着您分出更多组件而下降。您将这个数字除以得到归一化,就像您将协方差除以标准差的乘积一样,以获得介于 -1 和 +1 之间的相关系数。该分母包含两个变量和分量之间的两个相关项y你正在删除。这些相关项会随着您不断删除组件而上升,因为组件将包含越来越多的个体可变性/噪声。这使得分母整体下降。因此,当您删除更多组件时,分子和分母都会下降,前者是因为部分协方差下降,因为您正在删除共同/系统变异性,后者是因为组件捕获越来越多的个体变异性。

现在,分母开始比分子下降得更快,因为您在数据中消除的个体变异性多于系统变异性。这使得偏相关性上升。MAP 标准计算偏相关的平均值,并告诉您在平均偏相关停止下降并开始上升时停止,即当您开始删除比数据中的常见可变性更多的个体可变性时。