贝叶斯与常客对概率的解释

机器算法验证 可能性 贝叶斯 常客
2022-02-06 10:47:56

有人可以详细说明贝叶斯方法和频率论方法之间的差异吗?

据我了解:

常客的观点是,数据是具有特定频率/概率(定义为随着试验次数接近无穷大时事件的相对频率)的可重复随机样本(随机变量)。在这个可重复的过程中,基本参数和概率保持不变,并且变化是由于的可变性而不是概率分布(对于某个事件/过程是固定的)。Xn

贝叶斯观点是数据是固定的,而某个事件的频率/概率可能会发生变化,这意味着分布的参数会发生变化。实际上,您获得的数据会更改为每组数据更新的参数的先验分布。

对我来说,频率论方法似乎更实用/合乎逻辑,因为事件具有特定概率并且变化存在于我们的抽样中似乎是合理的。

此外,大多数研究数据分析通常使用频率论方法(即置信区间、使用 p 值的假设检验等)完成,因为它很容易理解。

我只是想知道是否有人可以快速总结一下他们对贝叶斯与常客方法的解释,包括常客 p 值和置信区间的贝叶斯统计等效项。此外,赞赏其中一种方法优于另一种方法的具体示例。

4个回答

频率论方法中,断言概率有意义的唯一意义是作为一系列试验中成功次数的极限值,即

p=limnkn

其中是成功次数,是试验次数。特别是,将概率分布与参数关联起来没有任何意义kn

例如,考虑的伯努利分布的(即,它们具有概率的值0 )。我们可以将样本成功率定义为X1,,Xnpp1p

p^=X1++Xnn

并讨论以p的值为条件分布,但倒置问题并开始讨论的观察值为条件的概率分布是没有意义的。特别是,这意味着当我们计算置信区间时,我们将置信区间的末端解释为随机变量,并且我们谈论的是“区间包含真实参数的概率”,而不是“参数为置信区间内”。p^ppp^

贝叶斯方法中,我们将概率分布解释为量化我们对世界的不确定性。特别是,这意味着我们现在可以有意义地讨论参数的概率分布,因为即使参数是固定的,我们对其真实值的了解也可能是有限的。在上面的例子中,我们可以使用贝叶斯定律反转概率分布f(p^p)

f(pp^)posterior=f(p^p)f(p^)likelihood ratiof(p)prior

问题是我们必须在分析中引入先验分布——这反映了我们的实际值之前值的信念。先验的作用在频率论者的方法中经常受到批评,因为有人认为它将主观性引入了原本严峻和客观的概率世界。pXi

在贝叶斯方法中,人们不再谈论置信区间,而是谈论可信区间,后者具有更自然的解释——给定 95% 的可信区间,我们可以指定参数在区间内的概率为 95%。

您对频率概率的解释是正确的:此设置中的随机性仅仅是由于抽样不完整。从贝叶斯的观点来看,概率是“主观的”,因为它们反映了代理人对世界的不确定性。说分布的参数“改变”并不完全正确。由于我们没有关于参数的完整信息,我们对它们的不确定性会随着我们收集更多信息而改变。

两种解释在应用中都有用,哪种更有用取决于具体情况。您可以查看Andrew Gelman 的博客,了解有关贝叶斯应用程序的想法。在许多情况下,贝叶斯主义者称之为“先验”,频率主义者称之为“正则化”,因此(从我的角度来看)兴奋会很快离开房间。事实上,根据 Bernstein-von Mises 定理,贝叶斯推理和频率推理在相当弱的假设下实际上是渐近等价的(尽管该定理明显不适用于无限维分布)。您可以在此处找到大量关于此的参考资料

既然你要求解释:我认为频率论者的观点在对科学实验进行建模时非常有意义。对于机器学习或归纳推理(或学习)建模中的某些应用,贝叶斯概率对我来说更有意义。在许多情况下,用固定的“真实”概率对事件进行建模似乎是不可信的。

对于一个回到拉普拉斯的玩具例子,考虑明天太阳升起的概率。从频率论者的角度来看,我们必须假设无限多的宇宙来定义概率。作为贝叶斯主义者,只有一个宇宙(或者至少不需要很多)。我们对太阳升起的不确定性被我们非常非常强烈的先前信念所压制,即明天它会再次升起。

概率的贝叶斯解释是一种置信度解释。

贝叶斯可能会说十亿年前火星上有生命的概率是1/2

常客会拒绝为该命题分配概率。这不是在所有情况下可以说是正确的事情,因此不能分配概率1/2

克里斯给出了一个很好的简单解释,正确区分了两种概率方法。但是频率论的概率论不仅仅是关注成功的长期比例。我们还考虑从分布中随机抽样的数据,并通过获取某些类型的数据平均值来估计分布的参数,例如均值和方差(例如,对于均值,它是观测值的算术平均值。频率论理论将概率估计称为抽样分布。

在频率理论中,我们能够通过从样本中取平均值来显示估计值将收敛到真实参数的平均值等参数。抽样分布用于描述对于任何固定样本大小 n,估计值与参数的接近程度。关闭由精度度量(例如均方误差)定义。

At Chris 指出对于任何参数,例如贝叶斯的均值,都会在其上附加一个先验概率分布。然后给定数据贝叶斯规则用于计算参数的后验分布。对于贝叶斯,所有关于参数的推断都是基于这个后验分布。

频率论者构建置信区间,这是参数合理值的区间。它们的构造基于频率论概率,即如果用于生成区间的过程对独立样本重复多次,则实际上包含参数真实值的区间的比例将至少是某个预先指定的置信水平(例如 95% )。

贝叶斯使用参数的后验分布来构建可信区域。这些只是参数空间中的简单区域,在这些区域上整合后验分布以获得预先指定的概率(例如 0.95)。可信区域被贝叶斯解释为具有包含参数真实值的高概率(例如,预先指定的 0.95)的区域。