简而言之,我的问题如下:
- 为什么假设正态分布的随机效应很常见(尤其是在广义线性混合模型中)?
更长的版本:
在某些情况下,近似正态分布的随机效应是有意义的。例如,假设我们根据个人的饮食类型 ( ),节食前一次和节食后每月一次。如果个体()被测量两次,则以下 LMM:
基本上假设个体()来自一些较大的群体,这会导致其初始权重出现随机、正态分布的偏移。有人可能会争辩说,无论个体(遗传、环境、生活方式)之间存在什么(未知)差异,都可能像独立随机变量的总和一样归结为正态分布。事实上,我们可以对结果变量 ( ) 的误差使用几乎相同的参数。
但是,假设我们在不同的岛屿( )上计算不同地形类型( )中的鸟类( )并使用泊松 GLMM ,为什么(如果有的话)正态性假设仍然站得住脚?当然,两个岛之间不同的随机变量之和会导致具有正态分布误差的结果出现正态分布偏移,但是我们如何证明非正态误差结构的合理性呢?
我知道 GLMM 对线性部分中的随机效应进行建模,但该线性部分是否仍不假定具有正常的误差结构?(对不起双重否定。)
奖金问题:
- 是否有任何非正态随机效应的简单示例(例如泊松分布)?