我应该使用混合效果吗?

数据挖掘 数据集 回归
2022-03-10 03:52:16

我在 Stata 中对一些 NBA 数据进行了 GLS 随机效应回归,我被告知这是错误的,因为我没有使用混合效应模型。情况可能确实如此,但我对这种解释感到很困惑。这是我使用Stata所做的:

  • 因变量是球队胜利,自变量是不同类型的对手投篮数据。

  • 使用 xtset 组合数据以说明不同的 NBA 赛季

  • 为固定效应和随机效应运行健壮的 xtreg
  • Hausman 检验的 chi^2 很高,所以我坚持使用 GLS 随机效应回归。

如果这是不正确的,请让我知道,以便我可以解决这个问题。当我的因变量是分类时,我一直认为混合效应模型适用于逻辑回归。有人告诉我,我没有在您的分析中考虑这种团队分组结构,但组变量是团队。

1个回答

当我的因变量是分类时,我一直认为混合效应模型用于逻辑回归

这根本不是真的。我们使用混合效应,特别是当我们有聚类数据时的随机截距,例如对个人的重复测量,或在学校、地区或国家等集群内进行抽样。这当然不是唯一的方法——相反,我们可以使用广义估计方程,或者只是为分组变量拟合固定效应,但是当有大量组时,我们可以合理地认为它们的“效应”是正态分布的,并且与残差或固定效应不相关,混合效应模型通常非常有吸引力。