确定性世界中机会的运作

机器算法验证 可能性 中心极限定理 直觉
2022-02-03 12:44:14

在史蒂文·平克 (Steven Pinker) 的《我们本性中的更好的天使》一书中,他指出

概率是一个视角问题。在足够近的范围内观察,个别事件具有确定的原因。即使是掷硬币,也可以从起始条件和物理定律中预测出来,熟练的魔术师可以利用这些定律每次都掷出头来。然而,当我们缩小范围以广角观察大量此类事件时,我们会看到大量原因的总和,这些原因有时会相互抵消,有时会朝着同一方向排列。物理学家和哲学家亨利庞加莱解释说,当大量微不足道的原因加起来产生巨大的影响时,或者当我们无法注意到的小原因决定了我们不能错过的大影响时,我们看到了在确定性世界中的偶然性。 .在有组织的暴力事件中,有人可能想发动战争;他等待时机,时机可能会到来,也可能不会到来;他的敌人决定交战或撤退;子弹飞;炸弹爆炸;人死。每个事件都可能由神经科学、物理学和生理学的规律决定。但总的来说,进入这个矩阵的许多原因有时会被打乱成极端的组合。(第 209 页)

我对加粗的句子特别感兴趣,但我给出了其余的上下文。我的问题:是否有描述 Poincare 描述的两个过程的统计方法?以下是我的猜测:

1)“大量的微不足道的因素加起来,产生了巨大的影响。” “大量原因”和“加起来”在我看来就像中心极限定理但在 CLT(经典定义)中,原因需要是随机变量,而不是确定性影响。这里的标准方法是将这些确定性影响近似为某种随机变量吗?

2)“一个我们没有注意到的小原因决定了我们不能错过的一个大影响。” 在我看来,您可以将其视为某种隐藏的马尔可夫模型但是 HMM 中的(不可观察的)状态转换概率就是概率,根据定义,这又一次不是确定性的。

4个回答

有趣的想法(+1)。

在情况 1) 和 2) 中,问题是相同的:我们没有完整的信息。概率是衡量信息缺乏的指标。

1) 微不足道的原因可能是纯粹的确定性原因,但通过确定性过程不可能知道哪些特定原因起作用。想想气体中的分子。力学定律适用,那么这里的随机性是什么?对我们隐藏的信息:哪个分子以什么速度在哪里。所以CLT适用,不是因为系统中存在随机性,而是因为我们对系统的表示存在随机性。

2) HMM 中有一个时间分量,在这种情况下不一定存在。我的解释和以前一样,系统可能是非随机的,但我们对其状态的访问具有一定的随机性。

编辑:我不知道 Poincare 是否在为这两种情况考虑不同的统计方法。在案例 1) 中,我们知道变量,但我们无法测量它们,因为它们太多而且太小。在案例 2) 中,我们不知道变量。两种方式,你最终都会做出假设并对可观察对象进行建模,并且我们通常会在案例 2 中假设正态性。

但是,如果有一个区别,我认为它会是浮现如果所有系统都是由微不足道的原因之和决定的,那么物理世界的所有随机变量都是高斯的。显然,情况并非如此。为什么?因为规模很重要。为什么?因为新属性来自较小规模的相互作用,并且这些新属性不必是高斯的。实际上,我们没有出现的统计理论(据我所知),但也许有一天我们会的。那么对于案例 1) 和 2) 有不同的统计方法是合理的

我认为您对声明的阅读过多。这一切似乎都建立在世界是确定性的并且人类对其进行概率建模的前提下,因为与通过物理的所有细节和描述它的任何其他数学方程相比,更容易估计正在发生的事情。我认为,关于确定性与随机效应的争论由来已久,尤其是在物理学家和统计学家之间。我对您之前加粗的以下句子感到特别震惊。“即使是掷硬币,也可以从起始条件和物理定律中预测出来,熟练的魔术师可以利用这些定律每次都掷出头来。” 当我在 1970 年代后期在斯坦福大学读研究生时,Persi Diaconis 是一名统计学家和魔术师,而 Joe Keller 是一名物理学家,实际上试图将物理定律应用于掷硬币,以根据关于是否是否正面朝上且准确;手指翻转的力量如何撞击硬币。我想他们可能已经解决了。但是,认为即使具有 persi diaconis 的魔法训练和统计知识的魔术师也可以掷硬币并每次都出现正面是荒谬的。我相信他们发现不可能复制初始条件,我认为混沌理论适用。初始条件下的小扰动会对硬币的飞行产生很大影响,并使结果不可预测。作为一名统计学家,我会说,即使世界是确定性的,随机模型在预测结果方面也比复杂的确定性定律做得更好。当物理学很简单时,可以而且应该使用确定性定律。例如,牛顿的万有引力定律适用于确定物体撞击地面时的速度,该物体从地面上方 10 英尺处落下并使用方程 d=gt2/2 您也可以非常准确地求解完成下落所需的时间,因为引力常数 g 已被确定为高精度,并且该等式几乎完全适用。

早期版本有一个不正确的 2N 第一个方程中的项,并且缺少一个 2N 在第三个等式中。感谢 Cardianl 注意到这一点

这不是一个完整的答案,但评论太长了。只是为了给出关于点 1) 的一些数学直觉,我们有以下大的限制N(使用斯特林近似,所以anbn方法limnanbn=1)

(NNf)12πNf(1f)exp(NH(f))

其中是熵函数。的二阶泰勒级数(关于的模式):H(f)=flog(f)+(1f)log(1f)H(f)12

H(f)log(2)+2(f12)2

所以我们还有:

(NNf)2N12πNf(1f)exp(2N(NfN2)2)

这些限制的含义是,任何包括计算某事可能发生的可能方式(例如因果分析)的程序都会导致正态分布。这不取决于是随机的还是确定的。中心极限定理所说的是,一组给定事件可能发生的大多数方式都可以很好地近似为正态分布。f

平克书中的引述和确定性世界的想法完全忽略了量子力学和海森堡不确定原理。想象一下在探测器附近放置少量放射性物质,并安排数量和距离,以便在预定的时间间隔内有 50% 的机会检测到衰变。现在将检测器连接到一个继电器,如果检测到衰减,该继电器将做一些非常重要的事情,并且只操作一次设备。

你现在已经创造了一种未来本质上不可预测的情况。(这个例子取自 1960 年代中期在麻省理工学院教二年级或三年级物理的人所描述的一个例子。)