SEM 程序中的回归与 SPSS 等统计软件包中的回归

机器算法验证 回归 结构方程建模
2022-03-24 17:36:24

上下文

具有连续变量的多元回归。

传统的统计软件包,例如 SPSS、R 中的 lm(),通常会给我一个F值、dfs 和一个关于模型是否表现良好的显着性检验。我还可以使用 ANOVA 通过确定 R 平方的增加是否显着来比较一个模型是否明显优于另一个模型。

结构方程建模程序,例如 Mplus,R 中的 lavaan 包,也允许我运行回归,并通过完整信息最大似然处理缺失数据的额外好处。尽管这两种方法之间的参数估计和 R 平方相似,但我没有得到F值和以 SEM 风格进行回归的模型的显着性检验。相反,我得到了 df 为的模型拟合信息,0但我不知道如何测试一个回归模型是否比另一个更好。

问题

  1. 如果有的话,这两种方法有什么区别?
  2. 在 SEM 风格中,我如何知道回归模型是好的,以及如何比较一个回归模型的 R 平方是否明显大于另一个?
1个回答

我认为通过 SEM 进行回归是虚假的。我的意思是,很高兴表明您可以将线性回归表示为 SEM 的一个特例,只是为了展示 SEM 的一般性,但是使用 SEM 进行回归是浪费时间,因为这种方法没有利用许多特定于线性模型的回归建模的进展。这是解决工作问题的正确工具:如果手头没有其他东西,我会用螺丝刀将钉子钉在干墙上,方法是用螺丝刀的尖端握住钉子并用手柄敲打钉子,但我不推荐一般来说,这样做。

在 SEM 中,您对所有事物的协方差矩阵进行建模:回归量和因变量。回归变量的协方差矩阵必须是无约束的。因变量和回归变量之间的协方差是产生系数估计的原因,而因变量的方差是s2. 所以你已经利用了所有的自由度(协方差矩阵条目的数量),这就是你看到零的原因。你应该仍然可以找到R2在你的输出中,但它会被深深地隐藏在某个地方,而不是像回归输出那样扔给你:从 SEM 的角度来看,你的因变量并不引人注目,你的输出中可能有几十个回归,你可以得到他们所有的R2TECHs 或可靠性,在某处,但您可能需要通过Mplus 中的一些选项来要求它。

缺失值的东西更加虚假。通常,您必须假设某种分布,例如多元正态分布,才能运行完整信息的最大似然。对于大多数应用程序来说,这是非常值得怀疑的,例如当您有虚拟解释变量时。

使用 R 或 Stata 正确进行回归的优势在于,您将可以访问所有传统诊断(残差、杠杆等影响;共线性、非线性和其他拟合优度问题),以及用于更好推理的其他工具(可以使异方差、聚类相关或自相关变得稳健的三明治估计器)。SEM 也可以提供“稳健”的标准错误,但当模型在结构上错误指定时(这就是我的一篇论文的内容),它们就不能很好地工作。