以下是我的理解:
p 值 - 当研究问题的原假设 (H0) 为真时,发现观察到的或更极端的结果的概率
也就是说 p-value。现在,当 p 值低于某个阈值 ( ) 时,我们拒绝原假设。
我知道我在这里遗漏了一些非常基本的东西,但是,如果零假设为真,而不是犯下检察官的谬误,那么基于低证据概率拒绝零假设如何?
以下是我的理解:
p 值 - 当研究问题的原假设 (H0) 为真时,发现观察到的或更极端的结果的概率
也就是说 p-value。现在,当 p 值低于某个阈值 ( ) 时,我们拒绝原假设。
我知道我在这里遗漏了一些非常基本的东西,但是,如果零假设为真,而不是犯下检察官的谬误,那么基于低证据概率拒绝零假设如何?
如果原假设为真,p 值是看到你看到的或更极端的东西的概率。p 值不是原假设为真的概率。所以是的,将 p 值解释为原假设为真的概率类似于检察官的谬误。如果您想要该概率,则需要在收集数据之前假设原假设为真的概率。然后,您可以使用收集的数据来影响或更新该初始概率。
是否选择“拒绝零假设”类似于检察官的谬误进入语义。如果“拒绝空值”意味着在概率意义上相信空值是错误的,那么是的,那就是犯了检察官的谬误。如果“拒绝空值”意味着表现得好像空值是假的,那是不同的。这是一个决策过程,其性能将取决于使用它的情况。
一个很好的例子是科学界对第一项研究的反应,该研究显示了 p < 0.0000003 的新粒子的证据。所有的科学家都接受粒子的存在吗?不会。有些人可能会,但有些人会持怀疑态度。信念的差异与零点的不同先验概率有关,即在实验之前他们对新粒子的存在有多怀疑。到目前为止,一项研究的结果只能改变他们的信念概率。
但是科学界是怎么做的呢?他们做了第二个实验。它们表现得好像粒子存在,或者更准确地说,它们表现得好像粒子的存在值得进一步研究。即使是持怀疑态度的科学家也会支持以这种方式行事。如果第二个实验的 ap < 0.0000003,一些持怀疑态度的科学家现在会相信粒子存在。为什么?即使第一个实验没有说服他们,它仍然改变了他们的信念概率。第二个实验将进一步改变它们。
第二个实验可能导致第三个实验,依此类推。每个科学家的基本信念分布随着每个实验而变化。在给定的实验之后,他们可能不同意粒子的存在,但仍然同意实验值得继续。最终,除了最持怀疑态度的科学家之外,这一系列实验将把所有科学家的信念分布转移到相信粒子的存在上。
个人说明:我并不是要向任何人推销这种统计范式;只回答最初的问题。还有其他值得探索的统计范式。贝叶斯分析有助于明确量化实验前后的信念分布。可能性推断有助于以一种具有不同先前信念的人仍然可以达成一致的方式来表达实验的证据。第二代 p 值将重点放在预先指定临床意义并为临床医生提供一个与他们希望传统 p 值一样的值,即仍然指示证据何时反对无效,但也区分何时证据是针对空值与不确定性仍然很高时的情况。还有许多其他有趣的方法。