如果2个随机变量具有完全相同的均值和方差

机器算法验证 分布 数理统计 方差 期望值 时刻
2022-03-29 06:45:48

如果两个连续随机变量具有完全相同的期望值和方差,它们是否总是具有相同的分布?

1个回答

简而言之:不。概率分布有几个属性不需要影响它的均值和方差,但确实决定了它的形状。

偏斜和峰度

例如,泊松分布λ=1有期望值λ=1和方差λ=1. 正态分布也是如此μ=1σ2=1.

具有两个连续分布的示例:采用指数分布λ=1, 这样它的方差也是λ2=112=1并将其与正态分布进行比较μ=1σ2=1. 这些具有相同的期望值和相同的方差,但看起来完全不同,并且会产生非常不同的数字:

偏斜和峰度改变分布而不影响均值或方差。

至于与这些均值和方差相等的分布有何不同:考虑分布的偏斜和过度峰度。这些都是0适用于正态分布,但不适用于指数分布。

多式联运

正如@Glen_b 指出的那样,偏斜和峰度并不是唯一需要考虑的事情。另一个例子是多模态:具有多个模态的连续分布可以具有与具有单一模态的分布相同的均值和方差,但显然它们不是同分布的。

例如,考虑两个正态分布的混合,每个正态分布σ2=1,但他们的手段是22, 分别。所得混合物的平均值为μ=0和方差σ2=5,与单个正态分布具有相同的期望和方差N(0,5)

影响形状的多模态,但不影响均值或方差。

如果你想自己尝试,这在 R 中很容易演示:

n <- 10e6             # some arbitrarily large sample size
y1 <- rnorm(n, -2, 1) # mixture component 1
y2 <- rnorm(n, 2, 1)  # mixture component 2
y.mixture <- c(y1, y2)
mean(y.mixture)
var(y.mixture)

相对:

y.single <- rnorm(10e6, 0, sqrt(5)) # R parameterizes with sd instead of var
mean(y.single)
var(y.single)