原则上这是一个分类问题。如果您知道哪个观察结果是真阳性,您可以只获取这些观察结果并估计它们的均值和方差。这样做,您隐含地假设真实值遵循由获得的均值和方差定义的正态(或更准确地说是 T 学生)分布:x¯¯¯s
μ~N(x¯¯¯,s)
因为您不确定哪些观察结果是真阳性,所以需要考虑各种情况。如果您要构建 100 个场景,那么在其中 80 个场景中,您将包含一个观察结果,您认为 80% 是真正的肯定。概率模型变得更加复杂:
p(μ)=p(μ |subset of the Xi)×p(subset of the Xi)
其中第一个因子右手边表示在给定观察子集的情况下第二个因素表示观察的某个子集包含所有真阳性且没有假阳性的概率。μ
那么如何得到标准差呢?您可以编写一个计算机程序,从上述概率分布中如果你之后有一个的列表,你可以用通常的方式计算平均值和方差:
此外,为了确保方差(或标准偏差)是对不确定性有意义的度量,您可以为和为特征的正态分布进行比较_μμ1,μ2,…,μN
μ=1N∑i=1Nμiandσ2=1N∑i=1N(μi−μ)2
μ1,μ2,…μσ
为了获得,您可以分两步执行采样。首先,对的一个子集进行采样。以下伪代码演示了如何做到这一点:μiXi
for each observation X_i do
P := probability for X_i to be a true positive
R := random number in [0,1] drawn from uniform distribution
if R smaller P
accept X_i as true positive
otherwise
reject X_i for the scenario
如果您使用统计编程语言,您也可以简单地使用该函数。Rsample
对于的采样子集,以通常的方式计算平均值和方差。和方差为特征的正态(更好的 T 学生)分布中绘制样本数据点。Xix¯¯¯sμix¯¯¯s
重复这两个步骤,直到你有足够的数据点来获得和的收敛。μiμσ