为什么因子分析模型中的回归系数称为“载荷”?

机器算法验证 因子分析 术语 教学
2022-03-20 19:05:51

这个线程中@ttnphns 写道

因为它是回归系数 [...] 我坚持说“因子负载变量”比“可变负载因子”更好。

我从这里了解到因子分析模型是方程组

V1=a1IFI+a1IIFII+E1

V2=a2IFI+a2IIFII+E2

...

Vp=

其中系数a是载荷,F是因子 [...],变量E是回归残差。

但是,我不明白我们应该说“因子负载变量”而不是反之亦然。使它遵循的“加载”一词是什么?

当我们已经有了术语“回归系数”时,我也不知道为什么我们需要术语“加载”。是不是因为有时回归系数也是相关系数,而统计学家想要一个通用术语来涵盖这两种情况?

我希望这个问题的答案能让学生更容易记住因素加载观察到的变量,而不是相反。

1个回答

我不明白我们应该说“因子负载变量”而不是反之亦然

抽象解释如果被视为对象的点在被视为特征的轴上具有坐标,则该坐标是特征加载该点的多少,它本身对该点充电多少。如果我的身高是 1.86 m,那么这就是我按高度加载的方式(而不是我加载了多少高度)。请注意,负载是负载图上因子轴上的变量坐标

潜在特征解释因素被概念化为一个实体,它在变量“中”或“背后”它们并使它们相互关联。因此,“负载”直观地是一个很好的词来表达变量依赖于潜在因素的程度,由潜在因素驱动。因子分析模型是回归模型,其中因子解释或“影响”观察到的变量。任何回归系数(不仅是因子分析)都可以标记为“载荷”:回归系数 = 回归权重 = 回归载荷。将因子的系数称为“负载”的更多理由是,在因子模型中,因子被设置为标准化的,每个单位方差,而变量FV不一定是标准化的。因此,对的影响是完全实现/表达的,并且通过加载系数。每当在回归模型中,标准化变量预测潜在的非标准化变量 - 将系数称为“加载”。V

当我们已经有了术语“回归系数”时,为什么我们还需要术语“加载”

我们其实不需要。单词“加载”只是源于心理学家喜欢比喻意义的传统(FA在一个世纪前开始在心理学家中发展)。此外,术语“加载”在其他相关的多变量方法(例如判别分析)中可能具有不同的统计含义。一般来说,有些人在某些情况下称“负荷”回归系数,而在其他情况下或在其他情况下 - 相关系数。所以这个词很混乱。归根结底,这不是一个统计术语。

如果您不喜欢这个词,请不要使用它。如果你愿意,你也可以说“可变负载(开)因子”;对我来说,这只是一种轻率的演讲,而不是恶习。

PS我刚刚查看了一本英语词典(英语不是我的语言)并观察到加载可能具有以下含义:(1)“我装载了购物车”(通过一个袋子,或者我自己装载);(2)“船载(上)许多乘客(上)”。如果按照第二个词的用法,可以说“变量很好地加载了因子(在自身上,变量上)”。