重新测量“坏”值

机器算法验证 测量误差
2022-04-04 07:05:12

我们有大量样本,我们测量了两次浓度,取两个值的平均值。通常,每个样本的变异系数 (cv) < 5%,但对于少数样本,cv 较高。我们假设在这些情况下,一个或两个浓度测量出现问题。对于具有高 cv 的样品,我们可以再进行一次浓度测量。

我的问题是,如何使用三个测量来实现对真实浓度的“最佳”估计?平均所有三个测量值?选择 cv 最低的两个?或者...?

非常感谢您对文学的任何见解或指示。

1个回答

如果错误测量的概率小于三分之二的错误测量的概率将非常小,因此忽略三个中离群的一个通常会给你两个有效的测量。

但是,我会记录所有测量的值,甚至是对同一受试者/样本的其他测量。借助有效和不良测量的数据收集,您可以研究不良和有效测量的分布。您可能还会看到错误值取决于真实值(因此携带信息),并且错误值和有效值都可能取决于同一受试者/样本的其他测量值。当您拥有不良和有效测量的(条件)分布以及不良测量的比例时,对于每个特定测量,您将能够计算它是不良的概率(来自其他分布),并计算最佳估计并建立置信区间。

我相信您的协议(如果 CV 较低,则保留两个,否则使用最低的三个 CV 对)开始可能很好,但我会在收集足够的数据以了解更多关于不良测量的信息后对其进行修改。然而,一个协议是否可以接受也取决于一个坏测量的概率、一个坏测量有多坏,以及一个坏的最佳值在其应用中的重要性。

我假设您在谈论 CV,因为您分析了一些现有数据并且发现 CV 是稳定的。这表明测量误差与值成正比,因此测量误差 SD 在对数刻度上是恒定的。如果是这样,采用几何平均值(而不是算术平均值)可能更准确。