频率论推理和观察条件(Wagenmakers 等人的例子)

机器算法验证 贝叶斯 置信区间 常客 哲学的
2022-03-22 02:15:47

我不是统计学专家,但我认为对于概率的“频率论”或“贝叶斯”解释是否是“正确”解释存在分歧。来自Wagenmakers 等。阿尔山口 183:

考虑具有均值的均匀分布μ和宽度1. 从这个分布中随机抽取两个值,标记最小的一个s和最大的一个l,并检查均值是否μ介于两者之间sl. 如果这个过程重复很多次,平均μ将介于两者之间sl在一半的情况下。因此,(s,l)给出 50% 的常客置信区间μ. 但是假设对于特定的平局,s=9.8l=10.7. 这些值之间的差异是0.9,这涵盖了分布范围的 9/10。因此,对于这些特定的值sl我们可以 100% 确信s<μ<l,即使常客置信区间会让你相信你应该只有 50% 的信心。

真的有人相信这个案子只有50%的把握,还是稻草人?

我想更一般地说,这本书似乎在说常客不能表达像“鉴于s=9.8l=10.7, s<μ<l概率为 1"。条件化是否意味着贝叶斯推理?

3个回答

其中涉及到一些复杂的作弊行为。置信区间(s,l)不使用制服的范围为 1 的信息,因此是非参数的,而关于样本的声明ls=0.9确实如此,并且高度依赖于模型。如果考虑到这些信息,我很确定可以提高置信区间的覆盖率或(预期)长度。一方面,分布的端点最多为1(ls)远离任何一个s或者l. 因此,100% 置信区间μ(l1/2,s+1/2).

这个特殊问题属于过去 10-15 年在理论计量经济学中广泛研究的部分确定分布的推理领域。对均匀分布的可能性和贝叶斯推断是丑陋的,因为它构成了一个非常规问题(分布的支持取决于未知参数)。

我很犹豫要不要回答这个问题。这些频率论者与贝叶斯论者的争吵通常是徒劳的,而且可能是令人讨厌和幼稚的。就其价值而言,Wagenmakers 是一件大事,而另一方面,在很大程度上被遗忘的 300 多岁的中国哲学家......

但是,我认为标准频率论者对 50% 置信区间的解释并不是说你应该对真实值在区间内有 50% 的信心,或者它有 50% 的概率。相反,这个想法很简单,如果无限期地重复相同的过程,包含真实值的 CI 的百分比将收敛到 50%。然而,对于任何给定的单个区间,它包含真值的概率是 0 或 1,但您不知道哪个

我认为这是一个强有力的案例的弱论据。

(s,l)在定义的意义上可能是 50% 的置信区间,但也是如此(3l+s14,3s+l+14),我认为后者在这种情况下可以说是更好的,因为它无需进一步调整到更大的样本量即可扩展;另请注意,后者的置信区间永远不会大于12及其大小样本的预期宽度n1n+1.