机器算法验证 - 如果我的 Cronbach alpha 值很高，但探索性因素分析的结果很差，这意味着什么 - 吾爱随笔录

如果我的 Cronbach alpha 值很高，但探索性因素分析的结果很差，这意味着什么

机器算法验证因子分析可靠性 cronbachs-alpha

2022-03-31 20:18:26

我接受了一项调查来分析。有50个问题，大约400名受访者。我已经计算了整个事情的 Cronbach alpha，我得到了大约 0.9。当我进行因子分析时，我没有得到很好的结果。根据它，我需要大约 17 个因素。

我的问题是：这怎么可能？我会认为 alpha 值告诉我答案都是合理相关的：同意 Q1 的人倾向于同意 Q2，依此类推。那么，不应该有少量的潜在因素吗？

3个回答

不必要。当项目相关性较弱时，您可能具有较高的 Cronbach's alpha。原因是 Cronbach 的 alpha 不仅取决于项目的相关性/协方差，还取决于项目的数量。如果项目的数量足够多（您的分析中可能就是这种情况），那么即使项目的相关性很弱，您的 Cronbach alpha 也会很高。举个简单的例子，我们可以看一下标准化 alpha的公式：

α_{standardized} = \frac{K \bar{r}}{1 + (K - 1) \bar{r}}

$\alpha_\text{standardized} = \frac{K \bar r}{1 + (K - 1)\bar r}$

其中是项目数，是项目之间的平均相关性。如果你有 50 个项目，0.15 的平均相关性将给出 0.9 的 alpha。如果是这种情况，从因子分析中得到糟糕的结果也就不足为奇了。 $K$ $\bar r$

对 Cronbach 阿尔法的批判性评估：Sijtsma, K., 2009。关于 Cronbach 阿尔法的使用、误用和非常有限的有用性。心理测量74, 107–120。

您不应将Cronbach 的 alpha与探索性因子分析一起考虑。Alpha来自可靠性领域，具体来说，是衡量一个量表内项目同质性（互换性）的指标之一；或更具体地说，关于 alpha - 为物品提供的量表有多少。进行因子分析以揭示潜在特征并验证假装基于一个因素的量表。请参阅可靠性与有效性视图。

根据经典的可靠性观点，问卷项目（得分相加或平均以给出整体量表得分）被视为对同一事物的重复测量。只考虑一个受访者和一个由两个项目组成的量表。他的反应被建模为：

项目 1 = T + e'和项目 2 = T + e''

T代表量表的“真实分数”。我们并不声称真正的分数是因子的某些潜在特征的值，尽管我们可能会这样做。实际上，真实分数背后可能有多种因素；它背后的问题超出了可靠性的范围。只要认为问卷测量的是“真实”的东西就足够了。T在两个方程中是相同的符号这一事实表明它在两个方程中是相同的值，表征我们的具体受访者对所测量的内容的拥有（或观点）（为简单起见，我们假设两个项目具有相同的所谓“难度级别”）。T是大写字母这一事实向我们传达了在答辩人内部level 它是一个固定的量，而不是一个可能变化的随机值。

e代表“测量误差”。可以将其概念化为在受访者回答时偶然发生的瞬时错误。项目确实在措辞上有所不同，但是模型认为被调查者对项目特性的反应与他出乎意料地打喷嚏以将笔熄灭一分一样。它是受访者中的单个随机变量（字母为小写字母），具有两个发生的实现，值e'和e''。像大多数噪声一样，它们被假定来自具有零均值和一些方差的正态分布。该方差是单个项目不可靠性的度量。为简单起见，我们假设这两个项目的方差相等，尽管它们可能不同。

现在回到问题的本质 - 为什么可靠性（至少以 Cronbach 的形式）可能会随着我们添加更多项目而增加（如@TEG 的答案所示）。因为T（在受访者水平上）是恒定的，并且项目是对同一事物的重复测量尝试，仅因无偏（对称）噪声e而变化，所以尝试（项目）1、2、3 越多，...我们使用越接近总和e'+e''+e'''+...为零，即他们的期望，因此项目的平均值越接近T。随着尝试的累积，消除了对均值的噪声影响。

如果没有错误项（可以这么说，没有“打喷嚏”效应），那么所有相关性都是完整的（r=1）并且 alpha'd 为 1。这只是由于假设的错误独立于项目，这意味着r 低于 1 - 因为最简单的可靠性模型声明除了真实分数T和“打喷嚏”错误e之外没有其他变化来源。只有 2 个项目，打喷嚏班次可能不会相互取消，但有很多项目他们会。因此，alpha 会随着错误更小（因此相关性更大）和/或相关项目更多而增长。

经典因子分析模型比经典的规模可靠性模型要复杂一些。让我们只有一个因素模型：

项目 1 = F + S1 + e'和项目 2 = F + S2 + e''

F是我们的量表（由项目组成）旨在衡量的潜在公因子。S1和S2分别是属于 item1 和 item2的特定因子。e是与前面描述的一样的随机误差项。

具体因素是未知的或无法衡量的，但它们是真实的，因为假设每个项目都包含与其他项目共同的东西（以及使它们相关的因素）和个别的东西（阻碍它们完全相关的因素）是现实的。各个部分S1和S2是系统的（即固定在给定的受访者水平上），就像因子F一样，它们是两个不同的值。

因此量表T1=F+S1和T2=F+S2的“真实分数”在不同项目中的量级不同。即使随着您添加越来越多的项目（带有单个S的）错误项总和e'+e''+e'''+...将收敛到零，它也无助于稳定无偏F (我们的目标）作为量表（项目的总和或平均值）所反映的东西，因为我们不知道S1+S2+S3...受访者中的值总和。将项目添加到量表（结构）并不一定会使量表更有效地作为其打算测量的潜在因素的量度，尽管量表在衡量“无论它测量什么”方面往往会增加可靠性，

重复一遍，可靠性测试假设项目是等效的，并且它们的分数只是随机噪声，因此添加足够数量的项目（如果可能的话，它们将更好地相关）恢复真实、无偏的量表分数。受访者。因子分析并不认为项目是等价的，它们包含内部的真实因素加上远离它的项目特定偏差，以及随机噪声；因此，总结项目（即使由于相同的因素而具有很好的相关性）并不能保证每个受访者对因素值的无偏估计。

此外，在因子分析中，我们实际上根本没有单独考虑测量误差 e。该术语被视为沉浸在称为“唯一因子” U的术语中：U1=S1+e'和U2=S2+e''，它补充了模型中的常见F。因子提取通常旨在最大化F方差，从而最小化整体U的方差。这意味着误差e的方差也受到约束，“预选”。这使得因子分析几乎无法与可靠性分析相媲美。但是，存在Alpha 因子分析这更类似于使用其 Cronbach 的可靠性分析。

例如，假设我做了一个关于健康饮食的调查。我的问题是：1）你喜欢樱桃番茄吗？2）你喜欢黄色的西红柿吗？每当受访者回答这些问题时，他都会打喷嚏并在纸上轻轻移动笔。如果我添加 2 个问题的答案，我会平均这个错误。随着我添加更多问题，我在 Chronbach alpha 公式的分母中得到更多协方差项，并且 - 假设协方差为正 - 随着我添加问题，alpha 变得更大。这被 alpha 公式中的 K/(K-1) 因子稍微抵消了，随着 K 的增加，它变得更小。（K 是问题的数量）。即使没有错误术语（没有打喷嚏）也是如此

现在进行因素分析：我正在寻找一个隐藏因素（“健康饮食”），现在我们看到问题 1 的答案由 3 件事组成：健康饮食、他对樱桃番茄的喜爱以及打喷嚏。添加更多问题会像以前一样平均打喷嚏，但不会让我更接近我的隐藏因素，因为我不断添加变量，例如他对黄色事物的喜欢等。

如果我在调查中找不到少量潜在因素，一定是一件坏事吗？

其它你可能感兴趣的问题

上一篇统计控制如何在逻辑回归中发挥作用？下一篇使用百分比之间的相关性是否合乎逻辑