两个正态分布变量的乘积分布何时接近正态分布?

机器算法验证 分布 正态分布 随机变量 正态假设
2022-04-05 10:32:16

很明显,正态分布变量的乘积不是正态分布的。例如,如果XN(μ1,σ12), YN(μ2,σ22), 然后XY没有分布N(μ1μ2,μ12σ12+μ22σ12).

有人告诉我,即使分配XY不是正态分布,分布XY接近正态分布,当μ1μ2没那么小,σ1σ2没有那么大。这是真的吗?

尝试以下 R 代码:

    n1 <- rnorm(10000,0,.005)
    n2 <- rnorm(10000,0,.005)
    n  <- n1*n2
    d  <- density(n)
    plot(d,lwd=2)
    x  <- par('usr')
    dn <- dnorm(d$x,mean=mean(n),sd=sd(n))
    x  <- seq(x[1],x[2],length.out=length(dn))
    lines(x, dn ,col=2, lwd=2)
    legend('topright', legend=c('Estimated density', 'Normal 
    distribution'), lwd=2, lty=c(1,1),col=c(1,2))

<span class= 时的密度估计σ1=σ2=0.005" />

似乎只有当两个条件都满足时,分布才接近正态分布。有没有理论分析?

1个回答

(这个答案使用了@whuber 的部分评论)

X,Y是两个独立的法线。我们可以将产品写为

XY=14((X+Y)2(XY)2)
将具有两个非中心卡方随机变量的差异分布(按比例缩放)(如果两者都具有零均值,则为中心)。请注意,如果方差相等,则这两项将是独立的。由于卡方分布是伽玛的一种情况,因此伽玛随机变量的通用总和 是相关的。我将给出一个非常特殊的情况,取自百科全书参考https://www.amazon.com/Probability-Distributions-Involving-Gaussian-Variables/dp/0387346570

什么时候XY是独立的,具有可能不同方差的零均值乘积的密度函数Z=XY是(谁)给的

f(z)=1πσ1σ2K0(|z|σ1σ2)
在哪里K0是第二类修正贝塞尔函数。

这可以用 R 写成

    dprodnorm  <-  function(x, sigma1=1, sigma2=1) {
       (1/(pi*sigma1*sigma2)) * besselK(abs(x)/(sigma1*sigma2),  0)
    }
    ### Numerical check:
    integrate( function(x) dprodnorm(x), lower=-Inf,  upper=Inf)
    0.9999999 with absolute error < 3e-06

让我们绘制这个,连同一些模拟:

    set.seed(7*11*13)  
    Z  <-  rnorm(10000) * rnorm(10000)
    
    hist(Z, prob=TRUE, nclass="scott", ylim=c(0, 1.5), 
            main="histogram and density of product of independent 
                  normals")
    plot( function(x) dprodnorm(x),  from=-5,  to=5,  n=1001,  
          col="red", add=TRUE, lwd=3)
    ### Change to nclass="fd" gives a closer fit

两个独立法线乘积的直方图和密度

该图非常清楚地表明分布并不接近正态分布。

所述参考确实也给出了更多涉及的情况(非零意味着......),但是密度函数的表达式变得如此复杂,以至于它们只给出特征函数,这仍然相当简单,并且可以反转以获得密度。