纵向数据:基线效应与随机截距

机器算法验证 面板数据 随机效应模型
2022-03-23 05:39:24

对于五个对象中的每一个,变量在时间点也可用于每个对象的是时间(基线)因此,样本量为我想拟合与时间的回归线。此外,在模型中包含基线测量对我来说很重要。Yt1t9Yt0=0n=50Y

可以包含随机斜率但没有随机截距吗?因此,我的模型将是: 其中是一个整体截距,基线效应,是总体斜率,与总体斜率的随机偏差

yij=(β0+β1t0i)+(β2+γi)tij+ϵij
β0β1β2γii

我担心的是已经导致了特定于对象的截距,因此我认为没有必要在模型中进一步包含随机截距。β1t0i

2个回答

首先,我认为您的模型规范有些混乱。我会用xi=yi0代替t0i作为tij用来表示时间j对于个人i. 您可能希望使用基线测量而不是基线时间作为协变量。所以你的模型应该是

yij=β0+β1xi+(β2+γi)tij+ϵij
为了i=1nj=19. 随机截距的目的是描述基线的差异,并将其延续到以后的时间点。即基线测量值较高的人以后更有可能进行更高的测量值。

挑战来了:上述模型不能用来描述基线发生的事情,因为基线测量已经作为协变量包含在模型中。所以使用上述模型来预测基线结果是没有意义的。在这种情况下,很难解释随机效应,您不应该将其包含在模型中。

话虽如此,如果您改变时间变量,那么包含随机截距确实是有意义的t1=0. 在这种情况下,您可以避免在模型不适用的时间点解释回归参数。

彼得

我假设j=1,...,9

是的,您可以将视为特定于对象的拦截。与随机截距的区别在于是固定的。这有点像计量经济学中固定效应和随机效应之间的区别所有对象共享相同的,然后由每个对象的基线值加权。如果基线测量很重要,则可以这样做。β1t0iβ1t0iβ1