存在误报时如何测量参数的不确定性?

机器算法验证 推理 测量 不确定 类型 i 和 ii 错误
2022-04-01 01:55:07

我研究的主要目标是测量昴宿星团形成星团中实际上是双星的褐矮星的百分比(即褐矮星有一个伴星围绕它运行)。

为此,我需要使用哈勃太空望远镜广角相机 3 估计在我们的观测中可探测到的最微弱的褐矮星是什么。

我的问题是这样的:

假设您测量参数X 100 次(X1,X2,...,X100)。只有真阳性检测和假阳性检测。

  1. 这些测量中的 80 次有 99% 的机会是真正的阳性。

  2. 20 次测量有 50% 的机会是真阳性(50% 的机会是假阳性)。

如果没有误报,则不确定性σX = 所有测量的标准偏差。

当如上所示存在误报时,您如何测量σX

详细说明:参数(X1,X2,...,X100)的每个测量值都有一定的误报概率(Pf1,Pf2,...,Pf100) . 因此,如何测量σX由于这些误报的存在而变得复杂。

1个回答

原则上这是一个分类问题。如果您知道哪个观察结果是真阳性,您可以只获取这些观察结果并估计它们的均值和方差。这样做,您隐含地假设真实值遵循由获得的均值和方差定义的正态(或更准确地说是 T 学生)分布:x¯s

μ~N(x¯,s)

因为您不确定哪些观察结果是真阳性,所以需要考虑各种情况。如果您要构建 100 个场景,那么在其中 80 个场景中,您将包含一个观察结果,您认为 80% 是真正的肯定。概率模型变得更加复杂:

p(μ)=p(μ |subset of the Xi)×p(subset of the Xi)
其中第一个因子右手边表示在给定观察子集的情况下第二个因素表示观察的某个子集包含所有真阳性且没有假阳性的概率。μ

那么如何得到标准差呢?您可以编写一个计算机程序,从上述概率分布中如果你之后有一个的列表,你可以用通常的方式计算平均值和方差: 此外,为了确保方差(或标准偏差)是对不确定性有意义的度量,您可以为为特征的正态分布进行比较_μμ1,μ2,,μN

μ=1Ni=1Nμiandσ2=1Ni=1N(μiμ)2
μ1,μ2,μσ

为了获得,您可以分两步执行采样。首先,对的一个子集进行采样。以下伪代码演示了如何做到这一点:μiXi

for each observation X_i do
  P := probability for X_i to be a true positive
  R := random number in [0,1] drawn from uniform distribution
  if R smaller P
    accept X_i as true positive
  otherwise
    reject X_i for the scenario

如果您使用统计编程语言,您也可以简单地使用该函数。Rsample

对于的采样子集,以通常的方式计算平均值和方差和方差为特征的正态(更好的 T 学生)分布中绘制样本数据点Xix¯sμix¯s

重复这两个步骤,直到你有足够的数据点来获得的收敛。μiμσ