机器算法验证 - 两种正态分布混合分布的逆变换采样 - 吾爱随笔录

两种正态分布混合分布的逆变换采样

机器算法验证采样随机生成混合分布累积分布函数加权抽样

2022-03-29 21:25:03

我对在以下问题中使用逆方法所需的特殊方式感到困惑，

这是问题所在：

考虑两个正态分布的混合分布，其中所需的 PDF由下式给出： $f(x)$

$f(x) = r\, f_a(x) + (1 − r)\, f_b(x)$ ，其中和是正常的 PDF，分别具有和的平均值（两者的标准差均为 1）。使用两个均匀随机变量和，解释我们如何使用反演方法从中采样。请注意，R 中的命令在这里可能会有所帮助。 $f_a$ $f_b$ $a$ $b$ $u_1$ $u_2$ $f(x)$ qnorm

我的困惑来自“两个统一的随机变量和 ”。我的想法是我们找出 cdf,（可以通过in R 获得），然后我们可以使用一些数值方法（例如 Newton-Raphson）来生成，所以这里只需要一个均匀分布，不需要. $u_1$ $u_2$ $F(x)$ pnorm() $x\sim f(x)$ qnorm()

我的方法有什么问题？问题是否提出了更好的方法？

2个回答

从混合物生成时，“两个制服”不是绝对必要的，但它们使模拟易于理解。正态分布的混合，具有与第一个正态相关联的概率质量。这意味着的分布可以分解为对于任何可测集，其中

r f_{a} (x) + (1 - r) f_{b} (x)

$rf_a(x)+(1-r)f_b(x)$

r

$r$

(1 - r)

$(1-r)$

X \sim f

$X\sim f$

P (X \in A) = r P (X_{a} \in A) + (1 - r) P (X_{b} \in A)

$\mathbb{P}(X\in\mathcal{A})=r\mathbb{P}(X_a\in\mathcal{A})+(1-r)\mathbb{P}(X_b\in\mathcal{A})$

A

$\mathcal{A}$

X_{a}

$X_a$ 和

X_{b}

$X_b$ 是具有均值的正态随机变量

a

$a$ 和

b

$b$ 分别。这可以重新解释为

X = {\begin{cases} X_{a} & with probability r \\ X_{b} & with probability 1 - r \end{cases}

$X=\begin{cases} X_a &\text{with probability $r$}\\ X_b &\text{with probability $1-r$}\end{cases}$ 这意味着要从混合物中生成，可以按照以下步骤操作

在组件之间挑选 $a$ 和 $b$ 通过生成制服 $U\sim\mathcal{U}(0,1)$ 而如果 $U<r$ 拿 $\mu=a$ 否则采取 $\mu=b$ ;
产生 $X$ 作为 $X_a$ 或者 $X_b$ 根据第一步的结果，通过生成一个统一的 $V\sim\mathcal{U}(0,1)$ 并采取 $X=\Phi^{-1}(V)+\mu$

这解释了使用两件制服。

这是STA511课程的问题吗？:)

pnorm() 不会给你正确的结果，因为它是一个 CDF。您正在寻找的是 CDF 的倒数，因此您必须使用 qnorm() 来获取它。

其它你可能感兴趣的问题

上一篇适用于 k-means 的数据集下一篇“Bayesglm”、p 值和自由度？