这个问题是关于 Aris Spanos 的概率减少 (PR) 方法中的预测试偏差、模型选择后的推断和数据窥探(这与 Deborah Mayo 的错误统计哲学有关;例如参见她的博客)。
我一直在阅读 Aris Spanos ( 2000 , 2010 , 2016 , 2017 , 1989 ) 关于计量经济学中 PR 方法的论文。该方法可简要概括如下。有两个出发点,理论和真实数据生成过程(DGP),两者相遇产生一个计量经济学模型:
- 理论理论模型可估计模型统计分析计量经济学模型。
- True DGP观测数据统计模型统计分析计量经济学模型。
上面的序列大多是不言自明的,除了统计分析部分。统计分析相当于序列{规范、估计、重新规范}迭代,直到满足统计模型的所有假设,从而使模型达到“统计上足够”。统计分析的最后一步是确定理论模型与估计的统计模型相关联,从而产生了计量经济学模型。
一旦计量经济学模型到位,人们可能会参与测试一些理论主张并进行推理。
请注意,Estimable 模型必须嵌入到“统计上足够”的统计模型中(即后者必须嵌套前者)以方便测试和推理。Spanos 强调,只有满足统计模型的所有假设时,推理才有效,即我们有一个“统计上足够”的模型。否则推断是不可靠的。*
问题:但是臭名昭著的测试前偏差和选择后推理和数据窥探的问题呢?
在 PR 方法中,统计模型旨在描述 DGP。值得注意的是,统计模型的制定独立于理论模型,并且仅基于观察到的数据。它的构建是为了反映数据中发现的机会规律。因此,在数据上尝试的第一个统计模型极不可能满足模型的所有基本假设;因此,将根据观察到的数据执行多个重新指定和估计的步骤。因此,“统计上足够”的统计模型将通过利用数据中的相当多的信息来构建。然后这个模型将用于推理。我的下意识反应:测试前偏差,选择后推断。
斯潘诺斯(2000)
Spanos 在2000 年解决了我的担忧(几乎完全专注于该主题)建议有一个单一的通用模型并且只考虑它的子模型,这允许在选择一些回归变量时跟踪顺序和多重测试中的实际显着性水平(例如第 4.5 节结束)。这与 Spanos 批评的新回归器附加一般模型形成对比。
他还在第 6.2 节中指出,诊断测试不会导致测试前偏差,因为在诊断测试失败后,建模者不应该自动选择测试的隐式或显式替代作为新的统计模型,而是必须检查这个模型首先使用错误规范测试。这让我想知道这是否不会导致至少轻微形式的预测试偏差,因为推断将取决于是否通过了错误规范测试。
2000 年第 6.3 节认可数据窥探是构建“统计上足够”模型的宝贵工具,但没有讨论其对推理的影响(大概是因为之前已经讨论过规范测试和模型重新规范的影响)。
斯潘诺斯(2010)
Spanos 还在2010年的第 6.1 和 6.3 节中解决了这些问题。在第 6.1 节中,他说
[F] 或许多统计模型,包括简单的正态和正态/线性回归模型,[错误规范] 测试可以仅基于最大辅助统计 <...>,它独立于完整的足够统计 <... > 仅用于主要推理。
在我的理解中,这意味着本质上,错误规范测试中对数据提出的问题与进行推理时提出的问题非常不同,前者的答案不会影响后者的答案,因此不会重复使用数据,也不会预先-测试偏差。就这么简单吗?
他在第 6.3 节结束时说
预测试偏压是错误的,因为它歪曲了模型验证,因为它可能会在两个模型之间进行选择
第 6 节中前面的讨论试图表明,在某种程度上,模型规格测试和失败测试后的模型重新规格与模型选择不同,并且不会导致测试前偏差。我很难理解这个论点......
也许我的问题的答案在于对在查看数据之前指定的一些理论主张的推断与对基于观察到的数据指定的数据的统计特性的主张的推断之间的区别? 即,由于统计模型是在不考虑理论的情况下构建的,因此它不会(也不能)滥用模型选择以更好地适应理论。因此,对理论的推论不会以系统的方式受到影响(例如,它既不偏向于拒绝也不偏向于接受某些理论主张)。同时,基于数据建立模型,然后测试该模型以在查看数据后对指定数据的统计特性进行推断当然是错误的,因为正在测试的假设受到数据中观察到的机会规律的启发因此,这是对数据的典型有害双重用途。
问题重申:臭名昭著的测试前偏差和选择后推理和数据窥探的问题在 PR 方法中不是真正的问题吗?为什么?(我不明白这个论点......)
*有趣的是,斯帕诺斯评论说,著名的短语“所有模型都是错误的,但有些是有用的”适用于实质性方面的错误(我们无法用我们的简单模型解释复杂的现实世界现象,但我们仍然可以从我们学到的东西中受益这些模型)但不是在统计方面(我们必须确保统计模型符合他们的假设;否则这些模型的推断将无效)。
参考:
- Spanos, A. (1989)。重读 Haavelmo:计量经济学建模的回顾性观点。 计量经济学理论,5 (3),405-429。
- Spanos, A. (2000)。重新审视数据挖掘:无论是否有许可证,“狩猎”。 经济方法学杂志,7 (2), 231-264。
- Spanos, A. (2010)。Akaike 型标准和推理的可靠性:模型选择与统计模型规范。 计量经济学杂志,158(2),204-220。
- 斯潘诺斯,A.(2016 年)。转变结构计量经济学:推论的实质与统计前提。 政治经济学评论,28 (3), 426-437。
- Spanos, A. (2017)。回顾错误规范测试。 经济调查杂志,即将出版。