具有高斯均值的高斯

机器算法验证 正态分布
2022-03-18 22:25:54

对不起,如果这个问题措辞不当,但我对此很陌生,我有以下情况:

我知道样本 X 是从高斯分布 G(u, v) 中抽取的。现在如果用另一个高斯随机变量代替 u,这个共轭分布会是什么?它仍然是高斯的吗?

编辑

只是为了让这一点更清楚,给定以下实验:

  1. 从具有已知均值和 var 的正态分布中采样一组点 Xs,
  2. 生成多个正态分布 Ds,其中每个 Ds 中的一个 Xs 是均值,并且所有 Ds 共享相同的已知 var,
  3. 从每个 D 中采样一组 Y,并将 Y 组合在一起。

我基本上是想知道 Ys 现在的分布是什么,它仍然是高斯分布吗,mean 和 var 是什么?

编辑

亚伦在他的回答中的演示非常清楚。虽然在我的研究中,我确实倾向于使用相当大的 n 和 m,但根据我自己的实验,结果点的分箱形状仍然非常类似于高斯,这让我再次想知道在给定大 n 的背后是否有理论证据而m,保证是高斯的?

这是我的一个实验的图表(我用不同的均值和方差多次运行它,它们看起来都很相似): n=1000, m=10000 的例子

上图是用 n=1000, m=10000, mean=0.95, std_dev1=0.07, std_dev2=0.7 生成的

1个回答

是的(假设它们是独立的)。将变量的均值从更改为等效于通过线性期望如果是正态分布的,那么两个独立的正态变量相加仍然是正态的。0xxx

更准确地说,让,然后感兴趣的变量是:XN(μ,σ12)YN(0,σ22)

X+YN(μ,σ12+σ22)

这仍然是正常的。

如果它们是依赖的,那么我认为我们不能对由此产生的分布做出太多结论。


编辑:为了解决修改后的问题,设是我们在步骤 1 中采样的次数,然后是我们在步骤 3 中从采样的次数。我之前的回复解决了的情况.nXmxi+Ym=1

对于个“子样本”中的每一个都依赖于相同的实现您可以将其视为单独的正态分布,每个正态分布在采样次后移动了正态分布的数量。可能没有更好的描述,但这取决于您要分析的内容以及您要回答的有关结果分布的问题。另请注意,取决于的相对大小(例如,如果趋于无穷大而保持不变,或者趋于无穷大而保持不变)或m>1mxinmnmmnnmσ12,你也许能想出一个合适的近似值。σ22

例如,以下直方图根据您的方案nmn=2m=10000μ=0σ12=50σ22=1

                 示例分布