为什么在验证性因子分析中将权重设置为 1?

机器算法验证 确认因素
2022-03-19 03:23:27

我参考以下文档的 p138-142 上的示例编写此问题:ftp: //ftp.software.ibm.com/software/analytics/spss/documentation/amos/20.0/en/Manuals/IBM_SPSS_Amos_User_Guide.pdf

以下是说明性数字和表格: 特许金融分析师示例

我知道潜在变量没有自然度量,并且将因子加载设置为 1 是为了解决这个问题。但是,有很多事情我不(完全)理解:

  1. 将因子加载固定为 1 如何解决这种规模不确定性问题?

  2. 为什么要固定为 1,而不是其他数字?

  3. 我知道通过将因子->指标回归权重之一固定为 1,我们因此使该因子的所有其他回归权重相对于它。但是,如果我们将特定因子加载设置为 1,但事实证明该因子的较高分数预测所讨论的观察变量的较低分数,会发生什么?在我们最初将因子加载设置为 1 之后,我们可以得到负的可理解回归权重,还是负的标准化回归权重?

  4. 在这种情况下,我看到因子载荷被称为回归系数和协方差。这两个定义都完全正确吗?

  5. 为什么我们需要将spatial->visperc 和verbal-paragrap 都修复为1?如果我们只是将其中一条路径固定为 1,会发生什么?

  6. 看标准化系数,怎么会是wordmean>sentence>paragrap的非标准化系数,但是看标准化系数paragrap>wordmean>sentence。我认为最初通过将 paragrap 固定为 1,加载到该因子上的所有其他变量都与 paragrap 相关。

我还将添加一个我认为有相关答案的问题:为什么我们将唯一项(例如 err_v->visperc)的回归系数固定为 1?err_v 在预测 visperc 时的系数为 1 意味着什么?

即使他们没有解决所有问题,我也非常欢迎回复。

4个回答
  1. 因为它允许您使用潜在变量和观察变量之间的关系来确定潜在变量的方差。例如,考虑 Y 对 X 的回归。如果允许我改变 X 的方差,例如,通过将它乘以一个常数,那么我可以任意改变回归系数。相反,如果我固定回归系数的值,那么这将确定 X 的方差。
  2. 按照惯例,以便更容易地相互比较系数。
  3. 在这种情况下,潜在变量简单地被反转了。例如,假设我们的潜在变量是数学能力,我们的观察变量是一次测试的错误数,我们将回归系数固定为 1。那么我们的潜在变量将变为“数学困难”而不是数学能力,并且任何其他观察到的变量的系数都会相应改变。
  4. 如果观察变量和潜在变量都是标准化的(即标准差等于1),则回归系数等于协方差。
  5. 它将空间 -> visperc 固定为 1,从而允许估计空间的方差(参见上面对 (1) 的答案)。同样,固定语言 -> 段落允许估计语言的方差。仅具有这些约束之一的模型将无法识别。
  6. 因为非标准化和标准化系数之间的差异不仅取决于verbal的方差,还取决于paragraph、sentence和wordmean的方差。例如,wordmean 的标准化系数等于非标准化系数乘以SDverbalSDwordmean2.234×9.682(2.2342×9.682)+19.925=0.841

最后,请注意 err_v 类似于回归模型中的误差项,例如, 我们将 err_v(即误差项)上的系数固定为 1,以便我们可以估计误差方差(即err_v的方差)。

visperc=β0+β1spatial+err_v

  1. 我可能误解了“规模不确定性”这个短语,但我相信它被设置为一个可识别性。(也就是说,这个方程组的未知数不能超过方程的个数。)如果没有将其中一个链接设置为一个,那么未知数太多了。这和规模不确定性是一样的吗?

  2. 在大多数 SEM 应用程序中,您使用的是协方差矩阵,而不是原始数据。还有一种使用原始数据的替代算法,称为 PLS(偏最小二乘法),它可能会为您提供一些额外的信息。

  1. 想想解释,就好像它只是一个简单的回归。该系数反映了与自变量中 1 个单位差异相关的因变量中的单位差异。因此,如果 IV 中 1 个单位的变化与 DV 中 1 个单位的变化相关联,那么这些单位在功能上是等效的。你需要一个潜在变量的单位,因为你想估计它的方差,这不是无单位的。识别问题是相关的,因为对于具有 1 个潜在变量和 3 个指标的简单 CFA,除非进行约束,否则无法识别模型。

  2. 您可以将其设置为任何数字,结果的整体性质将是相同的(通过查看模型拟合很容易检查,这将是相同的)。如果将其设置为 1,则更容易解释模型。

  3. 无论您如何修复任何因子负载,您都可以获得相同潜在变量的正负负载项目。您可以通过将其中一个指标乘以 -1 并再次估计您的模型来测试这一点。

  4. 如果回归系数未经调整(即因变量只有一个指向它的箭头),它们在功能上是相同的。如果是这种情况,可以从另一个计算一个。

  5. 尝试一下!由于已经说明的原因,每个潜在变量都需要一个尺度。

  6. 这是一个规模问题,正是使用标准化系数的原因。通过将 DV 除以越来越大的数字,我可以使任何回归系数任意大。因此,IV 中 1 个单位的变化将导致 DV 单位的变化越来越大。通过归一化和比较同类,我们避免了这个问题。

  7. 将错误因子加载固定为 1 只会使解释更容易。它使 SEM 中的相应回归方程采用熟悉的形式 Y = BX + e(或 Y = BX + 1*e)。

Stata 在这里有一个非常好的关于SEM的文档,查看“识别 2”部分,它可以回答你所有的问题。

没有规模是因为你的潜在变量是不可观察的。在幸福的调查中,你可能会想出数字答案,但幸福本身并不是直接衡量的。现在你必须以某种方式将诸如 1 到 10 之类的答案与幸福联系起来。因此您将其中一个问题指定为锚点并将其加载设置为 1。

它不必是 1,它可以是任何值,但 1 很方便。

空间和语言都是不可观察的,因此您需要为它们设置比例,因此每个都有锚点。