我们可以同时考虑古典和主观意义上的概率吗?

机器算法验证 可能性 贝叶斯 p 值 可能性 常客
2022-04-07 15:41:03

我是一名统计专业的学生。我试图理解概率的经典和客观定义,以及它们与频率论和贝叶斯推理的关系。对我来说,为什么经典概率与频率论推理配对以及为什么贝叶斯推理与主观概率配对并不明显。在某些来源中,我从Wellek 的这篇论文中读到了如下声明(抱歉,我找不到不在付费墙后面的版本):

从频率论者的观点来看,总体参数是不可观察的常数,无法对其做出有意义的概率陈述。

我试图了解这是否是由于概率的经典定义为重复试验,还是由于频率论推理的限制。

如果读者愿意跳过,我的具体问题在最后,但我想分享我的想法以防万一。

考虑随机变量在概率的经典定义下,如果我想科学地从经验上测量的概率,我认为我只需要重复实验大量次并进行统计。根据主观定义,我认为最初应该参考我自己的信念或理性主体的信念。当我收集更多数据时,这些信念就会被合理地修改。XP(X=x)

现在在我看来无法观察到,因此无法通过我的经典经验程序相比之下,我总是可以相信我无法直接观察到的事物,例如和我无法观察到的事物(例如 )之间的某种关系),这让我有信念关于我可以随着时间的推移合理地修改它。H0|XP(H0|X)H0|XXH0P(H0|X)

我突然想到,我也可以争辩说,对于常客来说,无论如何都是宇宙的固定属性,所以我可能会坚持认为是固定的,即使我可以观察到它。但是,如果我们考虑一下抛硬币的典型实验,然后我们将其修改为说我有大量的硬币供应,并且每次我记录一次抛硬币时我总是使用一个新的硬币。所以在那种情况下,我怀疑有一个潜在的参数是特定于硬币的,但我永远无法直接观察到它。因此,是有意义的,但我无法通过直接观察来计算它。H0H0pP(p=0.5|X)p

所以回到我的高级问题。

  1. 是否有任何有意义的方法可以将贝叶斯推理程序解释为常客?

  2. 是否有任何有意义的方法来进行贝叶斯推理,其中概率是根据概率的经典定义定义的?

1个回答

早期有一个非常相似的问题: 概率从根本上讲是关于参考类(真实的还是想象的)? 我真的很想在这里回答这两个问题。我们必须从什么是概率开始?

数学上的答案是,任何满足通常概率公理的东西都是概率。但这并不能真正回答我们的问题!因为我们在如何使用概率如何解释概率在我的想法中(今天,2018 年 3 月 7 日,明天......)所有概率概念(频繁的、主观的、个人的......)都有一个重要的共同点,这赋予了它们一个共同的含义。这就是校准参考类的概念。对于校准,请参见例如可视化模型预测概率的校准 或在此站点搜索“校准”。对于参考课程,第一个链接的帖子。

校准因您要校准的参考类类型而异:

  1. 对于经典的常客概率,我们正在针对一组明确定义的经验可观察和类似事件进行校准,例如重复投掷相同的硬币或骰子。这些概率被认为是客观的,因为大多数通情达理的人都会同意它们。
  2. 博彩公司需要根据他们的投注者池进行校准,以便从长远来看,他的输赢是平衡的。如果他的投注池作为一个集体,在 1) 的意义上被严重校准,那么博彩公司必须适应这一点。另一种说法是博彩公司的赔率(或概率)实际上是市场价格。
  3. 主观概率是由做出判断的人形成的具有不确定结果的事件的等价类。如果该人认为事件A、B是可交换这意味着对于这个人来说,在任何涉及而不是的投注系统中,他可以用并且仍然以相同的价格评估投注。此类事件必须具有相同的概率。因此等价类由被判断为具有相同概率的事件组成,并且校准是针对该类中事件的长期运行频率。A,BABAB

我们可以说概率有一个 Janus 脸:

在此处输入图像描述

(或者最好说概率是一个多头巨魔!)

有了这个观点,似乎有一个连续的解释,从非常客观到非常主观!不仅仅是离散的不同解释。很多关于概率的实际讨论都可以在这个概念中进行,例如:北海发生井喷的概率是多少?就在 Ekofisk 油田的 Bravo 井喷之前https://en.wikipedia.org/wiki/Ekofisk_oil_field议会对此进行了讨论,一位成员询问针对井喷风险采取了哪些措施,并提到了从墨西哥湾的历史经验中得出的概率。石油部长 Bjartmar Gjerde 回应说,这让他想起了那个有三个孩子的女人,不想再要更多了,因为她听说每个出生的第四个孩子都是中国人……在井喷的第二天,报纸的标题是这样的: “一个中国人出生在北海”。那么,墨西哥湾的经验是否应该用于形成北海的参考等级,或者以其他方式制定,墨西哥湾和北海的井喷应该一起校准还是单独校准?对于这些问题没有完全客观的答案,即使我们的目标是频率解释,这些评估也会部分主观。

所以“主观概率”中的“主观性”是指不同的理性人可以得出不同的评价,以不同的方式定义参考类,而不是“一切顺利”。为了使主观概率有意义,期望参考类(或校准程序)尽可能明确,以便进行讨论和批评。否则它只会退化为猜数字游戏。

因此,从这个意义上说,(主观)概率仅对可以校准概率的事件有意义。一个不可能的例子(我相信)是校准是不可能的,所以这样的概率不能有意义。的发生与否最终将是已知的,或者至少在原则上是可能的,我们才能谈论事件P(Does God exist)EE

所以对于你的第一个问题:

从频率论者的观点来看,总体参数是不可观察的常数,无法对其做出有意义的概率陈述。

好吧,常客选择不对未知(但固定的)参数值做出任何概率陈述,但他是否被迫做出这样的选择?现在,他不是。例如,让参数代表 20 岁挪威男性的平均身高。的事件(命题)进行投注是有意义的,例如但是上面我们说过“……我们只能在最终知道的发生与否的情况下谈论事件μmuE={μ<=1.73m}EEE? 不像公式化的那样,但是像德菲内蒂这样的贝叶斯主义者对这个问题进行了深入思考,并提出了以下解决方案。是对 20 岁挪威男性随机样本的身高观察。在取样之前,我们会对可能的值有一些期望。作为一个随机样本,的分布将是可交换的。deFinetti 证明了他的表示定理,一个(无限)可交换的可以表示为条件独立的给定一些潜在的潜在变量,例如(可能还有一些其他参数为),并且具有先验分布X=(X1,X2,,Xn,)XXμσ在这个潜在的变量/参数上。上构造一个(先验)概率分布,并且仍然将其视为一个未知常数!这可能看起来很奇怪,但可以通过将此分布视为认知分布而不是随机分布来解决。通过这种方式,对的赌注可以转换为对的赌注,我们可以解决这个问题。μμX

(还没有真正完成,有点深夜......)我希望这会有所帮助,我写这篇文章是为了澄清我自己的想法......要使这个设置在数学上严格,还有很多工作要做,虽然我希望可以做到。如果有人有一些有趣的相关参考,请加入...