何时在模型中包含随机效应

机器算法验证 随机效应模型 嵌套数据
2022-03-18 21:21:45

我是混合建模的新手,我对在我正在做的分析中使用随机效应是否合适感到困惑。任何意见,将不胜感激。

我的研究正在测试一个新开发的哺乳动物丰度指数如何能很好地预测一个既定但更劳动密集型指数的价值。我一直在多个森林斑块中测量这些指数,每个森林斑块中有多个地块。

因为我对森林斑块的影响并不直接感兴趣,而且因为我的样本地块嵌套在森林斑块中,所以我一直使用森林斑块作为随机效应。但是,我对此有几个问题:

首先,我知道随机效应可以让您在所有可能的随机因素水平上概括您的结果,而不仅仅是您抽样的那些。但在我看来,要做出这种推断,您的水平必须随机抽样?我的森林补丁不是随机采样的,所以我还能将它们用作随机效果吗?

其次,我读到您可以通过执行例如似然比测试来比较有和没有效果的模型来测试是否有必要产生随机效应。我已经这样做了,它表明随机效应模型不能解释数据以及仅具有固定效应的模型。我的问题是我的地块仍然嵌套在森林斑块中,因此可能不是独立的。那么,我可以使用这种 LRT 方法来证明排除随机效应的合理性,还是我仍然需要包括它来解释嵌套性?如果我最终消除了随机效应,有没有办法验证森林斑块内的地块可以被认为是独立的?

谢谢你的帮助!

周杰伦

1个回答

据我了解,您有一个简单的嵌套观察设计(补丁内的图),您的兴趣是两个连续变量(两个指数)之间的相关/回归。您的样本量是 m 个补丁 xn 个图 = N 对观察结果(如果不平衡,则为适当的总结)。没有涉及适当的随机化,但也许您可以/应该/想要考虑(1)补丁是从所有此类补丁或某个区域“随机”选择的,然后(2)地块是“随机”的在每个补丁中选择。

如果您忽略随机因素补丁,您可能会通过考虑“自由”随机选择 N 个图来进行伪复制,而不将它们限制为(数量或类型)在那些(先前)选择的补丁中。

所以,你的第一个问题:是的,这是随机因素所允许的。这种推论的有效性取决于随机选择等同于随机选择斑块的假设的有效性(例如,如果选择了一组不同的森林斑块,您的结果不会有所不同)。这也限制了您的推理空间:您的结果延伸到的森林或地理区域的种类取决于您的样本是可信的“随机”样本的最大(假想)斑块种群。也许您的观察结果是您所在地区森林斑块哺乳动物的“合理随机”样本,但可能是整个大陆哺乳动物的可疑汇总样本。

第二个:测试将取决于“伪复制的程度”,或者您的样本中绘制“属于”补丁的证据。也就是说,补丁之间和补丁内的地块之间有多少变化(搜索类内相关性)。在极端情况下,仅存在补丁之间的变化(补丁中的图都相同)并且您具有“纯伪复制”:您的 N 应该是补丁的数量,并且从每个补丁中采样一个或多个图并不能提供新的消息。在另一个极端,所有的变化都发生在地块之间,并且没有通过知道每个地块属于哪个森林斑块来解释额外的变化(然后没有随机因素的模型会显得更加简约);你有“独立”的情节。任何极端情况都不太可能发生……特别是对于在地面上观察到的生物变量,如果仅仅是因为哺乳动物的空间自相关和地理分布。无论如何,我个人更喜欢通过设计保留因子(例如,即使补丁不是此示例中变化的相关来源)以维持上面解释的“实验-观察”类比;请记住:您的样本中没有证据来拒绝零假设,即斑块之间的变异为零并不意味着总体中的变异为零。即使补丁不是此示例中变化的相关来源)以维持上面解释的“实验-观察”类比;请记住:您的样本中没有证据来拒绝零假设,即斑块之间的变异为零并不意味着总体中的变异为零。即使补丁不是此示例中变化的相关来源)以维持上面解释的“实验-观察”类比;请记住:您的样本中没有证据来拒绝零假设,即斑块之间的变异为零并不意味着总体中的变异为零。