因子分析的置换检验

机器算法验证 主成分分析 因子分析 置换检验 平行分析
2022-03-30 01:49:20

我们有一个调查工具,并且有兴趣评估它的维度。从多维尺度图来看,调查似乎有 3 个不同的维度,因为有 3 个看似明确定义的响应集群。

当我执行 Scree 图时,我观察到有 7 个维度的特征值大于 1,因此 Kaiser-Guttman 表明了这种反保守的高维度。通过生成与原始响应矩阵具有相同形状的独立随机正态值进行并行分析,在特征值与随机生成数据的特征值变得一致之前,给出了更加保守的 4 维。

但是,并行分析不考虑数据的编码和格式,以及零假设下可能协方差的不同分布。通过排列每列中的值来对原始响应数据进行排列测试是有意义的。这为这些值保持相同的均值和标准差,但在完全独立数据的零假设下找到相关矩阵的抽样分布。

以前有没有探索过这个?这种测试有名称吗?这种方法有警告吗?

1个回答

几位作者已经探索了基于重新随机化的组件保留标准。例如,Peres-Neto 等人 (2009) 实施了基于重新随机化的并行分析版本和蒙特卡罗并行分析(使用随机数据特征值的高百分位数,而不是平均值)。Dray 使用 RV 系数开发了一种基于重新随机化的组件保留方法。

旁白:我使用基于重新随机化的术语来表示生成不相关比较器数据集(例如并行分析中使用的比较器数据集)的过程。可以保留观察数据中每个变量的精确单变量分布X,同时减少与其他变量的相关性X通过独立地重新随机化(即改组,或在不替换所有观察值的情况下抽样)每个变量来获得机会。

然而,Dinno (2009) 发现并行分析对数据的分布形式不敏感。这是因为主成分分析中的(通常)分析对象是相关矩阵,R,并且对于任何合适的样本量,无论数据的分布如何,线性相关都会变得准确。

参考

A. 迪诺 (2009)。探讨霍恩并行分析对模拟数据分布形式的敏感性多元行为研究,44(3):362-388。

Dray, S. (2008)。关于主成分的数量:基于矩阵之间相似性测量的维度测试计算统计与数据分析,52(4):2228–2237。

Peres-Neto, P.、Jackson, D. 和 Somers, K. (2005)。有多少个主成分?用于确定重访非平凡轴数的停止规则计算统计与数据分析,49(4):974-997。