为什么大样本量的杂乱问题难以解决?

机器算法验证 贝叶斯 混合分布 后部
2022-03-26 10:16:58

假设我们有一组点每个点是使用分布 为了获得的后验,我们写 根据 Minka 关于期望传播的论文,我们需要计算来获得后验,因此,对于大样本量 ,问题变得难以处理。但是,我不明白为什么在这种情况下我们需要这么多的计算,因为对于单个y={y1,y2,,yN}yi

p(yi|x)=12N(x,1)+12N(0,10).
x
p(x|y)p(y|x)p(x)=p(x)i=1Np(yi|x).
2Np(x|y)Nyi可能性的形式为
p(yi|x)=122π(exp{12(yix)2}+110exp{120yi2}).

的简单乘法获得后验,所以我们只需要次操作,因此我们可以精确地解决大样本量的这个问题。p(yi|x)N

我进行数值实验来比较如果我分别计算每个术语并且我对每个使用密度乘积,我是否真的获得了相同的后验。后期是一样的。看看 我哪里错了?谁能告诉我为什么我们需要操作来计算给定和样本的后验?yi在此处输入图像描述2Nxy

2个回答

你说得对,报纸说错了。操作评估在已知位置的后验分布。问题是当你想计算后验的时刻。要准确计算的后验均值,您需要操作。这是本文试图解决的问题。xO(n)x2N

您错过了分布是高斯混合的观点:每个样本要么按照以概率分布,要么按照的杂波分布无关)以概率分布yip(yi|x)1wpc(y)yxw

为指示变量,指示样本是从杂波分布中抽取的;因此,如果它为,则表明样本是从中抽取的。显然,如果样本是从杂波分布中抽取的,那么它的值与的估计无关。cii0p(y|x)x

这些指示变量存在2N