不确定性与可变性的常客解释是什么?

机器算法验证 可能性 解释 不确定 常客 变化性
2022-03-29 13:46:28

我一直在阅读Begg, Welsh, and Bratvold (2014) ,这是对不确定性可变性之间区别的出色而清晰的讨论(从石油/地质统计学的角度来看)。摘要定义了它们:

“不确定性意味着我们不知道某个数量的值(或结果),......可变性是指一个数量在不同位置、时间或实例中具有的多个值”

并描述了它们是如何被捕获的:

“不确定性 [原文如此] 由概率分布量化,该概率分布取决于我们关于不确定数量的单一真实值的可能性的信息状态。变异性通过数量的多个实例的频率分布来量化,导出从观察到的数据。

这对我来说很有意义。总体内的变异性由某些频率质量函数(离散情况)或分布函数(连续情况)定义。如果我们有关于整个人口的完美信息,就没有不确定性,并且这些函数可以精确指定。如果我们没有关于总体的完美信息(例如,我们只能访问有限的样本,那么这些函数就存在一些不确定性,可以描述为估计频率或分布参数上的概率分布。

我的理解是,当我们问“人口中特定(未测量的)元素的真正价值是什么?”时,这种人口水平的可变性会崩溃到不确定性。. 这里的两个不确定性来源之间存在语义上的区别——群体变异性的不确定性是认知不确定性,群体变异性对样本不确定性的贡献是任意不确定性。

尽管它没有明确地这样描述,但我认为这是对概率的非常贝叶斯解释,因为他们将其描述为可解释为个人对给定明确声明的真值的信念度量。

我对频率论者对概率的解释是,如果可以测量整个总体(或样本数量趋于无穷大时样本估计的平均值的极限),它代表任何给定陈述的真实比例.

我可以看出这是有道理的(尽管不如贝叶斯解释那么多),但我发现很难在 Begg、Welsh 和 Bratvold (2014) 提供的这个框架中明确区分不确定性可变性. 认为常客概率实际上代表了这里的人口变异性,但在那种情况下,不确定性代表什么?只是样本估计的潜在错误?或者是其他东西?它是如何量化的?通过置信区间宽度?我觉得我在这里遗漏了一些细微差别。

参考

  • Begg、Steve H.、Matthew B. Welsh 和 Reidar B. Bratvold。“不确定性与可变性:有什么区别,为什么重要?” 在 2014 年 5 月 19 日星期一的第 1 天,D011S003R002。德克萨斯州休斯顿:SPE,2014 年。https ://doi.org/10.2118/169850-MS 。
2个回答

简短回答:我们对未知人口数量的任何不确定性(置信度)都是由于使用有限样本量的估计或测试程序的抽样可变性造成的。

完整答案:对于常客来说,人口级别的数量(通常用希腊字符表示)是固定的且未知的,因为我们无法对整个人口进行抽样。如果我们可以对整个人口进行抽样,我们将知道人口水平的感兴趣数量。在实践中,我们从总体中获得的样本有限,唯一可以客观描述的是估计和测试程序的操作特征。了解估计和测试过程的长期性能是使常客对从单个实验结果得出的结论充满信心的原因。实验者或其他任何人在实验之前或之后主观地相信什么是无关紧要的,因为这种信念不是任何证据。信念和意见不是事实。如果常客有历史数据(“先验知识”),则可以通过可能性将其合并到元分析中,并且不需要使用关于参数的信念概率。如果将固定人口数量视为随机变量,则可能会在估计和推理中引入偏差。我发现置信曲线是一种可视化频率推理的特别有用的方法,类似于贝叶斯后验分布。

不确定性意味着我们不知道某些量的值(或结果),例如特定储层的平均孔隙度(或储层内某个点的核心大小岩石的孔隙度)。可变性是指一个量在不同位置、时间或实例中具有的多个值——例如,不同储层集合的平均孔隙度(或特定储层内不同位置的岩心-塞孔孔隙度范围)。

我认为不确定性相当于认知不确定性(或模型不确定性;由参数不确定性引起,可以通过提供更多数据来减少),可变性是任意不确定性(或数据不确定性;数据中固有的不确定性,但无法减少)通过提供更多数据)。他们的区别在这个答案中得到了说明。

频率论模型只能捕捉任意不确定性,而贝叶斯两者都可以,那么频率论对(认知)不确定性的解释将毫无意义。

任意不确定性表示为跨类的分布,如果一个类的概率为 1,则该分布为零。认知不确定性表示为一类预测概率的散布,如果散布为零,则该散布为零。非贝叶斯神经网络不能表达认知不确定性(你不能对同一图像得到不同的预测),但 BNN 可以。

以上是这本书的引述:概率深度学习:使用 Python、Keras 和 Tensorflow 概率

它是如何量化的?

偶然的不确定性可以使用熵来测量,也可以按照本书的 8.5.2 中的说明来量化随机不确定性:概率深度学习:使用 Python、Keras 和 Tensorflow 概率