一种选择是使用模拟。因此,建立一个模型,您可以在其中具体指定异质性假设为var(αi)=X¯¯¯¯2iσ2u. 然后从这个模型生成你的数据,以随机截距为例。
αi=X¯¯¯¯iuiui∼N(0,σ2u)
Yij=αi+βXij+eijeij∼N(0,σ2e)
(希望这个符号有意义)。我相信玩这样的设置会帮助你回答问题 2)。因此,您将使用随机截距来拟合此模型,而实际上它应该是随机斜率(这为您提供了问题 3 的部分答案-随机截距可以在一定程度上解释“扇形”-这是“2 级扇形” )。上面的想法是尽可能地尝试打破你的建模方法——尝试与你对数据的了解一致的极端条件,看看会发生什么。如果您正在努力寻找这些条件,请不要担心。
我对 OLS 的异方差性进行了快速检查,它似乎对估计的 beta 影响不大。对我来说,似乎异方差性在某些地方会低估可能的错误,而在其他地方则会高估可能的错误(以预测的方式)。见下文:
在这里等待数据图,用户目前对计算机感到沮丧
我总是觉得有趣的一件事是人们担心的这种“数据的非正态性”。数据不需要正态分布,但误差项需要。如果这不是真的,那么 GLM 将不起作用 - GLM 使用似然函数的正态近似来估计参数,GLMM 也是如此。
所以我想说,如果估计固定效应参数是主要目标,那么不用担心太多,但是通过考虑异方差性,您可能会获得更好的预测结果。