什么决定了不确定度的精度?

机器算法验证 测量误差 不确定 精确
2022-03-29 20:37:47

是什么限制了您描述测量不确定度的精度?

我将描述两个感觉质量不同的例子,但我不确定它们在处理不确定性的方式上是否存在数量上的不同。

  1. 用以厘米为单位的尺子测量铅笔的长度。使用这样的测量设备,您可以准确地确定铅笔的长度,精确到整厘米,然后您可以进一步估计小数点后一位 (mm)。例如,可以确定铅笔长 7.3 厘米。测量的不确定性在于测量的十分位值。对不确定性的一个估计可能是 0.5 毫米,因为这本质上是人们可以做出的最大合理误差,而不会导致该值“溢出”到另一个毫米单位。因此有人报告铅笔的长度为:7.3 ± 0.05 cm。在这里,仅对单个对象执行一次测量。报告的不确定性是最后一位小数的不确定性,因此只有一个有效数字。

    顺便说一句,在这个例子中,除了我描述的 0.5 毫米的“合理高估”之外,还有什么其他方法可以估计测量中的不确定性?此外,尺子精度的不确定性是如何发挥作用的?在我的示例中,我假设尺子本质上为我们提供了厘米的定义,但实际上尺子上的刻度标记可能会出现一些错误(尽管很小)。

  2. 测量一组几乎相同的铅笔的长度。通过对这些对象的重复测量(每支铅笔一次测量,对多支铅笔重复测量),人们可以收集一组此类铅笔长度的测量值。由此,可以确定这种铅笔的平均长度(L)。这种铅笔长度的不确定性估计值可以作为测量值的标准偏差 (σ) 找到。此时,可以将铅笔的长度报告为:L ± σ。我们会说这些测量是使用与第 1 部分相同的尺子进行的,即以厘米为单位进行刻度的尺子,并以精确到毫米的精度记录各个测量值。因此,L 最多应该具有 mm 精度(再比如说 7.3 cm)。σ 呢?

    我看到三种可能的情况:

    A) 测量值的分布非常紧密,例如 σ = 0.0000034873 cm(故意显示模拟计算器输出的内容)。在这里,不确定度的第一个有效数字是一个远小于测量设备最小精度的值。有人会报告 0 mm 或 3E-6 cm 的不确定性吗?这些都感觉不对。(1) 的不确定性如何发挥作用?

    B) 测量值的分布非常广泛,例如 σ = 4.3289483 cm(很明显,这些铅笔几乎不再像以前假设的那样几乎相同)。现在,不确定性中最重要的数字与平均值的数量级相同。那么人们会忽略测量的毫米精度并报告长度为 7 ± 4 厘米吗?在这里,我将平均值四舍五入到相同的最高有效小数(在本例中为整数厘米)。

    C) 分布介于上述两种极端情况之间,例如 σ = 0.295401 cm。现在将所有内容简单地四舍五入到最接近的毫米并将长度报告为 7.3 ± 0.3 厘米似乎是合理的。

    是否有理由报告具有多个有效数字的不确定性?例如,7.3 ± 1.3 厘米?

3个回答

你的铅笔例子很特别。当我描述这种精确性在典型案例中的工作原理时,您就会明白为什么。

比如说,你正在用一个有 1 毫米刻度的卷尺测量一个房间。你得到 10033 毫米的测量值。报告此问题的方法是 10033 0.5 mm。您通常将一半的刻度作为先验不确定性±σ=0.5

为了提高精度,您多次测量房间:10033、10041、10031。现在您可以计算标准偏差 mm,因此您可以排除先验不确定性,并报告您会看到如何σ35.310035±5σ3>σ

您的标尺以 1 厘米刻度分级,然后先验精度通常报告为 0.5 厘米,但您当然可以接近 1 毫米精度的眼球,所以可能 0.5 毫米是一个合适的精度来报告。另外,谁会用 1 厘米分级尺测量铅笔?我会说这不是完成这项任务的合适工具。事实上,我从未见过有 1 厘米刻度的尺子,即使是建筑中使用的卷尺也会有 1 毫米的刻度。

使用 1 毫米刻度尺或标准卡尺,其先验精度将远低于通过几次重复测量计算得出的不确定度。这样您就无需处理仪器精度与您感兴趣的主题之间的相互作用。

在 A 中,测量值的标准偏差小于单次测量的误差,这将来自于反复测量,例如 7.30 0.05 cm,在这种情况下,每次测量的不确定度都不能忽略错误传播——事实上它占主导地位。±

在 B 和 C 中,将平均值四舍五入到匹配的最高有效数字或保留一个额外的数字是典型的,例如,可以在粒子物理书籍/小册子的 PDG 评论或 arxiv.org 上的论文中看到。

在 C 中,请注意 7.3 1.3 cm 具有有用的信息:如果其他人测量 8.5,这是“在不确定范围内”,但如果您报告 7 1 cm,则不会。±±

您问

“是否有理由报告具有多个有效数字的不确定性?例如,7.3 ± 1.3 cm?”

一方面,7.3 ± 1.3 的相对不确定度为 1.3/7.3 = 0.178,而 7.3 ± 1 的相对不确定度为 1/7.3 = 0.137。你说你在第二种情况下比在第一种情况下“知道更多”。以夸大已知信息的方式陈述不确定性不是一个好习惯,因此不确定性应以两位有效数字表示。人们可以扩展这个逻辑,并认为我们应该在不确定性中使用超过两位数,但不确定性中的不确定性太大,以至于这通常是不合理的。