我想从单变量密度中采样,但我只知道关系:
我想避免使用 MCMC(直接在积分表示上),并且由于和很容易从中采样,我正在考虑使用以下采样器:
- 对于。
- 样本。
- 样本。
然后,我将得到对,并且只取边缘样本。 它是否正确?
我想从单变量密度中采样,但我只知道关系:
我想避免使用 MCMC(直接在积分表示上),并且由于和很容易从中采样,我正在考虑使用以下采样器:
然后,我将得到对,并且只取边缘样本。 它是否正确?
是的,这是正确的。基本上,你有
正如你所说,你可以从联合密度中取样。仅从样本中提取 s 会导致您从边缘分布中获取样本。
这是因为忽略的行为类似于对它进行积分。让我们通过一个例子来理解这一点。
假设 = 母亲的身高, = 女儿的身高。目标是从中获取样本,以了解女儿和母亲身高之间的关系。(我假设家中只有一个女儿,并将人口限制为所有 18 岁以上的女儿,以确保充分成长)。
你出去得到一个有代表性的样本
因此,对于每个母亲来说,你都有他们女儿的身高。和之间应该有明确的关系。现在假设从您的数据集中,您忽略了女儿的所有数据(删除),那么您有什么?你有随机选择的母亲的确切高度,这将是从的边缘抽取。