我在这里的一篇博文中看到了这张图片。
我很失望,阅读这份声明并没有引起我和这个人一样的面部表情。
那么,零假设是常客如何表达无信息先验的陈述是什么意思?这是真的吗?
编辑:我希望有人可以提供一个慈善的解释,使声明成为真实,即使在某种松散的意义上。
我在这里的一篇博文中看到了这张图片。
我很失望,阅读这份声明并没有引起我和这个人一样的面部表情。
那么,零假设是常客如何表达无信息先验的陈述是什么意思?这是真的吗?
编辑:我希望有人可以提供一个慈善的解释,使声明成为真实,即使在某种松散的意义上。
原假设不等同于贝叶斯无信息先验,原因很简单,贝叶斯也可以使用原假设并使用贝叶斯因子进行假设检验。如果它们是等价的,贝叶斯就不会使用零假设。
然而,频率论者和贝叶斯假设检验都包含了自我怀疑的成分,因为我们需要证明有一些证据表明我们的替代假设在某种程度上比随机机会更合理地解释了观察结果。频率论者通过具有显着性水平来做到这一点,贝叶斯论者通过对贝叶斯因子进行解释来做到这一点,这样我们就不会强烈地发布假设,除非零假设上的贝叶斯因子足够高。
现在,常客假设检验违反直觉的原因是常客无法为假设的真实性分配一个非平凡的概率,遗憾的是,这通常是我们真正想要的。他们最接近这一点的是计算 p 值(在 H0 下观察的可能性),然后从中得出关于 H0 或 H1 是否合理的主观结论。贝叶斯可以为假设的真实性分配一个概率,因此可以计算出这些概率的比率以提供它们的相对合理性的指示,或者至少可以说明观察结果如何改变这些概率的比率(这是什么贝叶斯因子确实如此)。
在我看来,试图在频率论和贝叶斯假设检验方法之间进行过于接近的平行是一个坏主意,因为它们根本不同并且回答根本不同的问题。将它们视为等价会鼓励对具有潜在危险的频率检验(例如 p 值谬误)进行贝叶斯解释(例如,气候怀疑论者经常假设全球平均地表温度缺乏统计上显着的趋势意味着存在一直没有变暖——这根本不正确)。
你脸上不像那个人那样顿悟的原因是我认为。. . 该声明不正确。
零假设是假设控制条件和实验条件之间的任何差异都是偶然的。
无信息先验是为了说明您有关于某个问题的先验数据,但它并没有告诉您任何有关下一轮预期的信息。贝叶斯可能会认为任何先前的信息都存在,甚至是均匀分布。
所以零假设说控制和实验之间没有区别;另一方面,一个无信息的先验可能是也可能不是,如果它确实表明控制和实验之间的差异没有任何意义(这不同于表明任何差异是由于机会造成的)。
不过,也许我缺乏对无信息先验的理解。我期待其他答案。
请参阅此维基百科文章:
对于单个参数和数据可以总结为单个充分统计量的情况,可以证明,如果未知参数是位置参数 (...),则可信区间和置信区间将重合,其先验为是均匀平坦分布 (...),如果未知参数是具有 Jeffreys 先验的尺度参数 (...)。
事实上,参考指向杰恩斯:
Jaynes, ET (1976),置信区间与贝叶斯区间。
在第 185 页中,我们可以找到:
如果情况 (I) 出现(而且发生的频率比人们意识到的要多),贝叶斯检验和正统检验将导致我们得出完全相同的结果和相同的结论,但对于我们应该使用“概率”还是“概率”存在口头上的分歧。意义”来描述它们。
所以,事实上也有类似的情况,但如果你使用柯西分布作为可能性,我不会说图像中的陈述是真实的......
我是创建该图形的人,尽管如随附帖子中所述,这最初并不是我的见解。让我为它是如何出现的提供一些背景信息,并尽我所能解释我是如何理解它的。认识发生在与一个学生的讨论中,他当时大部分时间都学习了贝叶斯推理方法。他很难理解整个假设检验范式,而我正在尽力解释这种明显令人困惑的方法(如果您认为“差异”是负面的 - 因为不是等于 - 那么标准的零假设方法是三重否定:研究人员的目标是证明没有差异)。一般来说,正如另一个回应中所述,研究人员通常期望存在一些差异。他们真正希望找到的是“拒绝”无效的令人信服的证据。然而,为了不偏不倚,他们首先假装无知,例如,“好吧,也许这种药物对人的影响为零。” 然后他们继续通过数据收集和分析(如果可以的话)证明,在给定数据的情况下,这个零假设是一个糟糕的假设。
对于贝叶斯主义者来说,这似乎是一个令人费解的起点。为什么不直接宣布你先前的信念开始,并通过在先前的编码中明确你是(和不是)假设的?这里的一个关键点是统一的先验不是与无信息先验相同。如果我掷硬币 1000 次并得到 500 个正面,我的新先验为正面和反面分配相等(均匀)的权重,但它的分布曲线非常陡峭。我正在对信息量很大的附加信息进行编码!一个真正的无信息先验(达到极限)根本没有分量。实际上,这意味着从头开始,并且用常客的说法,让数据自己说话。“克拉伦斯”的观察是,对这种信息缺乏进行编码的常客方法是使用零假设。它与无信息的先验并不完全相同。这是以诚实的方式表达最大无知的常客方法,这种方法不假设您希望证明什么。