我一直在阅读Begg, Welsh, and Bratvold (2014) ,这是对不确定性和可变性之间区别的出色而清晰的讨论(从石油/地质统计学的角度来看)。摘要定义了它们:
“不确定性意味着我们不知道某个数量的值(或结果),......可变性是指一个数量在不同位置、时间或实例中具有的多个值”
并描述了它们是如何被捕获的:
“不确定性 [原文如此] 由概率分布量化,该概率分布取决于我们关于不确定数量的单一真实值的可能性的信息状态。变异性通过数量的多个实例的频率分布来量化,导出从观察到的数据。
这对我来说很有意义。总体内的变异性由某些频率质量函数(离散情况)或分布函数(连续情况)定义。如果我们有关于整个人口的完美信息,就没有不确定性,并且这些函数可以精确指定。如果我们没有关于总体的完美信息(例如,我们只能访问有限的样本,那么这些函数就存在一些不确定性,可以描述为估计频率或分布参数上的概率分布。
我的理解是,当我们问“人口中特定(未测量的)元素的真正价值是什么?”时,这种人口水平的可变性会崩溃到不确定性。. 这里的两个不确定性来源之间存在语义上的区别——群体变异性的不确定性是认知不确定性,群体变异性对样本不确定性的贡献是任意不确定性。
尽管它没有明确地这样描述,但我认为这是对概率的非常贝叶斯解释,因为他们将其描述为仅可解释为个人对给定明确声明的真值的信念度量。
我对频率论者对概率的解释是,如果可以测量整个总体(或样本数量趋于无穷大时样本估计的平均值的极限),它代表任何给定陈述的真实比例.
我可以看出这是有道理的(尽管不如贝叶斯解释那么多),但我发现很难在 Begg、Welsh 和 Bratvold (2014) 提供的这个框架中明确区分不确定性和可变性. 我认为常客概率实际上代表了这里的人口变异性,但在那种情况下,不确定性代表什么?只是样本估计的潜在错误?或者是其他东西?它是如何量化的?通过置信区间宽度?我觉得我在这里遗漏了一些细微差别。
参考
- Begg、Steve H.、Matthew B. Welsh 和 Reidar B. Bratvold。“不确定性与可变性:有什么区别,为什么重要?” 在 2014 年 5 月 19 日星期一的第 1 天,D011S003R002。德克萨斯州休斯顿:SPE,2014 年。https ://doi.org/10.2118/169850-MS 。