机器算法验证 - 如果随机效应在统计上不显着，我应该从模型中排除它们吗？ - 吾爱随笔录

机器算法验证混合模式随机效应模型咕噜咕噜

2022-03-22 06:08:38

我是否应该在模型中包含随机效应，即使它们在统计上不显着？我有一个重复测量实验设计，其中每个人随机经历三种不同的治疗。我想控制个人和秩序的任何影响，但在我的模型中似乎都没有统计学意义。这是否可以排除它们，还是我仍然应该包括它们？

1个回答

我的建议是在模型中包含随机效应，即使它们在统计上不显着，因为这样统计分析会更忠实地代表实际的研究设计。

这使您可以在“统计方法”部分中编写类似的内容：

对个体和顺序包括随机效应，以控制由于重复测量或顺序效应而可能产生的依赖性。

这可能会阻止审阅者对依赖假设或伪复制发表评论。这样做比“解释”为什么可以删除这些术语更容易，即使它们看起来基本上没有用。

此外，在模型中包含这些术语可能不会让您付出任何代价。如果您删除它们时结果发生巨大变化，我会感到惊讶和怀疑。

以下是一些注意事项：

务实：

有时，数据的分布不允许模型拟合数据。当由于成本、时间或努力而故意收集的试验很少，当数据在某些方面过于稀疏，或者当数据的分布变得退化或过于平坦时，就会发生这种情况。

在这种情况下，除了简化模型之外，您可能没有其他方法可以继续进行，可能会大大简化。通常，我会尝试首先删除最细粒度的效果，因为通常有更多的效果需要估计。

在最坏的情况下，您可能希望像数据是独立收集的一样继续进行。这可能总比没有好，但重要性测试将不得不用一大粒盐来进行。应该对结果的解释进行相当多的对冲。

实际的：

在某些情况下，合并术语以获取一些信息以继续进行可能是合理的。在这里，我更多地考虑正在进行的研究和开发中的实验设计，而不是出版。

Lorenzen 和 Anderson (1993) 给出了“有时合并”规则，以帮助对模型中的其他因素进行更精确的测试。

不过，在我看来，这种类型的规则更适合实际使用，而不是用于出版用途。

理论：

现在，实际上，当您放弃这些随机效果时，您可能会得到基本上“相同”的结果。这很好，但您应该知道您现在正在拟合两个不同的模型，并且这些术语可能需要以不同的方式解释，即使它们可能是“相同的”。

我从中得出的结论是，在各种假设下，结果都是稳健的。这总是一件好事。

删除术语也可以被认为是“模型选择”、“模型构建”或“模型简化”的一部分。模型选择有多种方法。而“删除无关紧要的条款 $p$ -values”就是这样一种方法，一般来说，它在理论上似乎没有太多支持。我不确定各种方法在混合模型中的表现如何。

此外，根据您希望如何解释模型的结果，您可能不希望“简化”它。Littell等人（2006 年）在简单的设置中就狭义与广义推断以及总体与特定主题推断进行了一些讨论（第 211 页）。在您的情况下，您可能对广泛的推断感兴趣，得出与整个人群有关的结论，而不仅仅是您研究中的个人。

无论如何，就您而言，您的研究是以一种基于秩序和个人的方式引入潜在依赖的方式进行的。如果您可以准确地模拟您的研究结构，那么您应该这样做。

参考：

Littell、Milliken、Stroup、Wolfinger 和 Schabenberger (2006)用于混合模型的 SAS。SAS。

Lorenzen 和 Anderson (1993)实验设计：一种无名的方法。 马塞尔·德克尔公司

其它你可能感兴趣的问题