数据点来自正态混合物分布的概率

机器算法验证 可能性 分布 混合分布 跳转
2022-04-03 11:21:53

使用 JMP,我能够使用 normal-2 混合模型将分布拟合到一组数据。它返回用于创建正态 2 混合的两个正态分布中的每一个的位置(或平均值)、离散度(标准差)和概率。现在,我希望能够从该人群中获取任何数据点,并找出数据点来自两个分布中的每一个的几率。有没有办法做到这一点?

1个回答

让我们将人口 1 和人口 2 的估计称为

μ1μ2对于手段,σ1σ2对于sd。另外,让我们定义p为来自总体 1 的观测值的估计比例。

然后,对于每个观察xi,属于人口 1 的估计概率是

=pN(xi;μ1,σ1)pN(xi;μ1,σ1)+(1p)N(xi;μ2,σ2)

在哪里N(xi;μ1,σ1)是正常密度。如果使用 JMP,您可以使用

Normal.Density( (x_i - mu_1) / sigma_1) )

因为 JMP 中的正态密度函数只接受标准正态分布的参数。

属于人口 2 的估计概率当然是 1 减去属于人口 1 的估计概率。