可能重复:
在什么情况下应该使用多级/分层分析?
我一直在阅读有关多级分析的各种论文,老实说,我仍然很困惑:在数据聚类时选择简单的 OLS 回归或多级(随机或混合)模型,但研究的主要重点是个人-水平(而群体水平的影响被视为令人讨厌)?在这种情况下,最“正确”的方式是什么?
可能重复:
在什么情况下应该使用多级/分层分析?
我一直在阅读有关多级分析的各种论文,老实说,我仍然很困惑:在数据聚类时选择简单的 OLS 回归或多级(随机或混合)模型,但研究的主要重点是个人-水平(而群体水平的影响被视为令人讨厌)?在这种情况下,最“正确”的方式是什么?
您有两个主要选择:
多级分析肯定是花哨的和热门的。这也是它被大量滥用的原因,因为每个人似乎都想做多层次的事情,不管他们的数据是否适合它。我对本网站上大约 2/3 的带有此标签的问题的反应是,该研究的目标(除了在排名靠前的期刊上发表,这通常是许多研究的目标)可以通过其他方法更好地解决。在多级分析中,您必须做出强有力的假设:(i)您的随机效应是正态的(或者,如果您的随机斜率与随机截距一样长,则联合分布是多元正态的),(ii)您的模型包含所有相关变量,因此您可以安全地假设错误和回归量在所有级别上都不相关,(iii)您在每个级别都有足够的观察结果来真正利用关于似然比检验统计量和信息矩阵逆的渐近理论结果作为参数估计方差的估计量。这些假设大部分时间都被掩盖了,而且很少被检查过。处理它们的方法确实存在,但它们需要博士学位。在统计中阅读它们。还有其他贝叶斯解决方案,在你敢于打开这些论文之前,它们也需要贝叶斯计算中的可靠统计序列。并且很少检查。处理它们的方法确实存在,但它们需要博士学位。在统计中阅读它们。还有其他贝叶斯解决方案,在你敢于打开这些论文之前,它们也需要贝叶斯计算中的可靠统计序列。并且很少检查。处理它们的方法确实存在,但它们需要博士学位。在统计中阅读它们。还有其他贝叶斯解决方案,在你敢于打开这些论文之前,它们也需要贝叶斯计算中的可靠统计序列。
具有聚集误差的 OLS 做出的假设更少:类似于上面的 (ii),即能够说服自己回归量和误差是不相关的,以及类似于 (iii) 的东西,您有足够的集群以便方差-协方差估计是作为足够多的独立项的总和获得的。请注意,与多级模型不同,您不需要在每个集群的观察数方面有渐近线。关于具有聚类标准误差的 OLS 的一个令人不快的副作用是,如果您的模型具有 40 个变量且只有 30 个聚类,您可能会用完自由度。(好吧,如果你有 30 个集群,那么无论如何你都搞砸了。)
多层次模型的一个有趣特征是它们可以处理层次之间的交互(例如,教师的教育和经验如何影响学生的收获?)通过显式构建交互,在 OLS 中也可以解决问题,但也有可能。并将它们用作回归中的解释变量。
有了足够的数据,您就可以对两个模型估计的参数的有效估计量(多级模型)和效率较低但更稳健的估计量(具有聚类标准误差的 OLS)之间的差异进行分析并构建 Hausman 规范检验。大多数时候,坦率地说,比起多级分析,我更相信具有聚类标准误差的 OLS。