根据测量误差选择先验

机器算法验证 贝叶斯 标准错误 错误 事先的 测量误差
2022-03-16 01:18:20

如果您有仪器的测量误差,您如何计算适当的先验?这一段来自 Cressie 的《Statistics for Spatio-Temporal Data》一书:

通常情况下,一些关于测量误差方差的先验信息是可用的,从而可以指定一个相当丰富的参数模型。例如,如果我们假设条件独立的测量误差是独立同分布的 Gau(0,σϵ2),那么我们应该为σϵ2. 假设我们对环境空气温度感兴趣,我们看到仪器制造商的规格表明存在的“误差” 。假设这个“错误”对应于 2 个标准偏差(应该检查的假设!),我们可以指定的先验平均值为±0.1°Cσϵ2(0.1/2)2=0.0025. 由于仪器制造商的规范,我们假设分布在 0.0025 处具有明确定义且相当窄的峰值(例如,反伽马)。事实上,我们可以固定在 0.0025;然而,数据模型误差也可能具有其他不确定性成分(第 7.1 节)。为避免过程模型错误可能出现的可识别性问题,建模人员在科学允许的范围内尽可能减少不确定性非常重要,包括进行旨在复制数据的辅助研究。

有谁知道如上所述获得先验值的一般程序是什么(尽管该段仅指获得先验均值)?

1个回答

两种标准方法

  1. 请参阅报价单中的“仪器制造商规格” 。这通常是在没有其他信息可用时使用的粗略回退,因为 (a) 仪器制造商所说的“准确度”和“精确度”的真正含义通常是不确定的,以及 (b) 仪器在新仪器出现时如何响应测试实验室的性能可能比在现场使用时要好得多。

  2. 收集重复样本。 在环境采样中,大约有六个级别的样本被常规复制(以及更多可以复制的级别),每个级别都用于控制可分配的变异来源。此类来源可能包括:

    • 取样人的身份。
    • 在获取样本之前进行的初步程序,例如打捞井。
    • 物理采样过程中的可变性。
    • 样品体积本身的异质性。
    • 保存样品并将其运送到实验室时可能发生的变化。
    • 初步实验室程序的变化,例如均质化物理样品或将其消化以进行分析。
    • 实验室分析员的身份。
    • 实验室之间的差异。
    • 物理上不同的仪器之间的差异,例如两个气相色谱仪。
    • 仪器校准随时间漂移。
    • 昼夜变化。(这可能是自然的和系统的,但当采样时间是任意的时可能会显得随机。)

只有根据适当的实验设计系统地改变这些因素中的每一个,才能获得对可变性成分的完整定量评估。

通常只研究被认为贡献最大可变性的来源。例如,许多研究将在获得样本后系统地拆分一定部分的样本,并将它们运送到两个不同的实验室。对这些拆分结果之间差异的研究可以量化它们对测量变异性的贡献。如果获得了足够多的此类分割,则可以在分层贝叶斯时空模型中将测量变异性的完整分布估计为先验。因为许多模型假设高斯分布(对于每个计算),获得高斯先验最终归结为估计分裂之间差异的均值和方差。在更复杂的研究中,旨在识别不止一个方差分量,

甚至考虑这些问题的好处之一是,它们可以帮助您确定减少甚至消除其中一些错误成分的方法(无需量化它们),从而更接近 Cressie & Wikle 的“减少不确定性”的理想在科学允许的范围内。”

有关扩展工作示例(在土壤采样中),请参见

Van Ee、Blume 和 Starks,土壤采样误差评估的基本原理。 美国环保署,1990 年 5 月:EPA/600/4-90/013。