具有良好的常客属性意味着什么?

机器算法验证 贝叶斯 术语 常客
2022-03-18 09:02:11

我经常听到这句话,但从来没有完全理解它的意思。目前,“良好的常客属性”一词在 google 上的点击量约为 2750 次,在 Academic.google.com 上为 536 次,在 stats.stackexchange.com 上为4 次

我发现最接近明确定义的东西来自斯坦福大学演示文稿的最后一张幻灯片其中指出

[T] 报告 95% 置信区间的含义是,即使在不同的估计问题中,您也可以在 95% 的声明中“捕获”真实参数。这是具有良好频率特性的估计程序的定义特征:它们在重复使用时经得起审查。

稍微思考一下,我认为“良好的常客属性”一词意味着对贝叶斯方法的一些评估,特别是对区间构造的贝叶斯方法。我了解贝叶斯区间旨在包含具有概率的参数的真实值。频率主义区间的构造使得如果区间构造过程重复多次,大约的区间将包含参数的真实值。贝叶斯区间通常不承诺有多少百分比的区间将覆盖参数的真实值。但是,某些贝叶斯方法也恰好具有这样的性质,即如果重复多次,它们会覆盖大约pp100%p100%的时间。当他们拥有该属性时,我们说他们具有“良好的常客属性”。

是对的吗?我认为肯定不止于此,因为该短语指的是良好的常客属性,而不是具有良好的常客属性

3个回答

良好的常客属性的一个棘手之处在于它们是过程的属性,而不是特定结果或推理的属性。从长远来看,一个好的常客程序会在特定比例的案例上产生正确的推论,但一个好的贝叶斯程序通常会在所讨论的个别案例中产生正确的推论。

例如,考虑一般意义上的“好”贝叶斯过程,因为它提供了正确表示证据(似然函数)与先验概率分布组合的后验概率分布或可信区间。如果先验包含准确的信息(例如,而不是空洞的意见或某种形式的无信息先验),则该后验或区间可能会比来自相同数据的常客结果产生更好的推断。在导致对这个特定情况的更准确推断或更窄的估计间隔的意义上更好,因为该过程使用包含准确信息的定制先验。从长远来看,区间的覆盖百分比和推理的正确性受每个先验质量的影响。

请注意,该过程没有指定如何获得先验,因此从长远来看,性能核算可能会假设任何旧的先验,而不是为每种情况定制设计的先验。

贝叶斯过程可以具有良好的频率特性。例如,在许多情况下,具有配方提供的无信息先验的贝叶斯过程将具有相当好到极好的频率特性。那些好的属性将是一个意外而不是设计特征,并且将是这种过程的直接结果,该过程产生与常客过程相似的间隔。

因此,贝叶斯程序可以在单个实验中具有出色的推理特性,而从长远来看具有较差的频率特性。等价地,具有良好长期频率特性的频率分析程序在单个实验的情况下通常表现不佳。

我会回答你的分析是正确的。为了提供更多见解,我会提到匹配先验。

匹配先验通常是设计用于构建具有频率属性的贝叶斯模型的先验。特别是,它们被定义为使获得的 hpd 区间满足置信区间的常客覆盖(因此 95% hpd 中的 95% 包含长期的真实值)。请注意,在 1d 中,存在解析解:Jeffreys 先验是匹配先验。在更高维度上,情况并非如此(据我所知,没有结果证明情况并非如此)。

在实践中,这种匹配原则有时也用于调整模型的某些参数的值:地面实况数据用于优化这些参数,因为它们的值最大化了感兴趣参数的结果可信区间的频率覆盖率. 根据我自己的经验,这可能是一项非常微妙的任务。

如果有什么我可以做的贡献,让我先澄清一下,然后直接回答你的问题。关于该主题(贝叶斯程序的frequestist属性)存在很多混淆,甚至专家之间存在分歧。第一个误解是“贝叶斯区间旨在以概率包含参数的真实值p.” 如果您是纯贝叶斯(不采用任何频率论概念来评估贝叶斯过程的人),则没有“真实参数”之类的东西。频率论世界中固定参数的主要兴趣量是随机变量在贝叶斯世界中。作为贝叶斯主义者,您不会恢复参数的真实值,而是恢复“参数”的分布,或者它们的矩。

现在,回答您的问题:不,这并不意味着对贝叶斯方法的任何评估。跳过细微差别并专注于估计过程以使其保持简单:统计中的频率论是估计未知的固定数量或检验假设,并根据假设的重复评估该过程的想法。您可以采用许多标准来评估程序。使它成为常客标准的原因是,人们关心如果一个人一遍又一遍地采用相同的程序会发生什么。如果你这样做,你就会关心常客属性。换句话说:“什么是常客属性?” 意思是“如果我们一遍又一遍地重复这个过程会发生什么?” 现在,是什么让这种常客属性是另一层标准。被认为是好的属性的最常见的常客属性是一致性(在估计中,如果你继续抽样,估计量将收敛到你正在估计的固定值),效率(如果你继续抽样,估计量的方差将变为零,所以你会越来越准确),覆盖概率(在程序的多次重复中,95% 的置信区间将在 95% 的时间内包含真实值)。前两个称为大样本属性,第三个是 Neyman-genuinelyfrequentist 属性,因为它不需要使用渐近结果。因此,总而言之,在频率论框架中,存在一个真实且未知的价值。你估计它并且你总是(除了在罕见的幸运事故中)估计错误,但你试图通过要求至少在假设无限期重复你的估计的情况下拯救自己,你会越来越少错误你知道你会是对的一定次数。鉴于这不是您的问题,我不会讨论它是否有意义,或者证明它合理所需的额外假设。从概念上讲,这就是常客属性所指的内容,并且在这种情况下通常意味着什么。

我将通过向您指出这篇论文作为结束,以便您自己判断它是否有意义以及贝叶斯程序具有良好的常客属性意味着什么(您会在那里找到更多参考资料):

  • Little, R. 等人,(2011 年)。校准贝叶斯,一般用于统计数据,尤其是缺失数据。统计科学,26(2),162-174。