我有两个来自类似心理语言学实验的数据集。在这两者中,都收集了有关参与者阅读和拼写能力的信息,然后将其转换为标准化分数 zRead 和 zSpell。目的是在检查实验的启动效应时将这些用作协变量。因为这些预测变量是相关的,并且因为理论上区分它们的共享方差和它们的独特影响是有用的,所以我正在研究使用主成分,即从 zRead 和 zSpell 分数生成两个主成分,并将它们用作协变量线性混合模型。
问题在于,虽然每个实验的主成分相似,PC1 索引共享方差,PC2 区分阅读和拼写能力,但 PC2 的符号在每个数据集中是不同的,即:
实验一相关表:
zSpell zRead PC1a PC2a
zSpell 1.000 0.504 0.867 -0.498
zRead 0.504 1.000 0.867 0.498
PC1a 0.867 0.867 1.000 0.000
PC2a -0.498 0.498 0.000 1.000
实验二:
zSpell zRead PC1a PC2a
zSpell 1.000 0.485 0.862 0.508
zRead 0.485 1.000 0.862 -0.508
PC1a 0.862 0.862 1.000 0.000
PC2a 0.508 -0.508 0.000 1.000
目的是将两个相关数据集一起呈现,因此解释 PC2 如何在每个数据集中表示(稍微)不同的事物可能会令人困惑。是否可以通过乘以 -1 来反转单个组件的分数?如果不是,如果解释更有意义,是否可以一次反转所有组件?我看不到这会改变变量的相关结构,但我不确定是否有其他原因可以避免它。