我很清楚回归模型中逐步/向前/向后选择的问题。有许多研究人员谴责这些方法并指出更好的替代方案。我很好奇是否有任何故事存在统计分析:
- 已使用逐步回归;
- 根据最终模型得出一些重要结论
- 结论是错误的,对个人、他们的研究或他们的组织造成负面影响
我对此的想法是,如果逐步方法不好,那么使用它们应该在“现实世界”中产生后果。
我很清楚回归模型中逐步/向前/向后选择的问题。有许多研究人员谴责这些方法并指出更好的替代方案。我很好奇是否有任何故事存在统计分析:
我对此的想法是,如果逐步方法不好,那么使用它们应该在“现实世界”中产生后果。
被问到的问题不止一个。最狭窄的一个是要求一个示例,说明逐步回归何时因为逐步执行而造成伤害。这当然是正确的,但只有当用于逐步回归的数据也已发布时才能明确确定,并且有人对其进行重新分析并发布同行评审的更正以及已发布的主要作者撤消。在任何其他情况下提出指控都有可能采取法律行动,而且,如果我们使用不同的数据集,我们可能会怀疑犯了错误,但“统计数据永远不能证明任何事情”,我们将无法确定错误是制作; “排除合理怀疑”。
事实上,一个人经常得到不同的结果,这取决于一个人是逐步消除还是逐步建立回归方程,这向我们表明,这两种方法都不够正确,无法推荐其使用。显然,还有其他事情正在发生,这给我们带来了一个更广泛的问题,上面也问过,但以项目符号的形式,相当于“逐步回归有什么问题,无论如何?这是一个更有用的问题,并且有额外的好处是我不会因为回答它而对我提起诉讼。
为逐步 MLR 正确执行,意味着使用 1)物理上正确的单位(见下文),以及2) 适当的变量转换以获得最佳相关性和误差分布类型(对于同方差性和物理性),以及3) 使用变量组合的所有排列,而不是逐步,所有这些,以及4) 如果一个人执行详尽的回归诊断,那么一个人会避免错过否则会误导的高 VIF(共线性)变量组合,那么奖励是更好的回归。
正如上面 #1 所承诺的,我们接下来探索物理系统的正确单位。由于回归的良好结果取决于对变量的正确处理,因此我们需要注意物理单位的通常维度并适当地平衡我们的方程。此外,对于生物学应用,需要了解和考虑异速生长的维度。
请阅读这个生物系统物理研究的例子,了解如何将单位平衡扩展到生物学。在那篇论文中,遵循了上述步骤 1) 到 4),并使用广泛的回归分析找到了一个最佳公式,即,, 在哪里是肾小球滤过率,是分解代谢的标志,其中单位使用分形几何来理解,使得,重量是一个四维分形几何构造,而 V,体积,被称为欧几里得或三维变量。然后. 使公式在维度上与新陈代谢一致。这不是一个容易掌握的陈述。考虑到 1) 通常不被重视(未知)的是是新陈代谢的标志。2) 分形几何很少被教授,即使是受过数学训练的人也很难掌握所提出公式的物理解释。