两个不同的分布能否具有相同的均值、方差、偏度和峰度值?

机器算法验证 描述性统计 偏度 峰度
2022-03-21 03:47:28

假设您有两个离散的总体分布。

它们能否具有相同的均值、方差、偏度和峰度值,同时在视觉上形状不同?

这四个值是否像任何分布的指纹?

2个回答

取两个具有密度的正态分布的混合

f(x|μ1,μ2,σ1,σ2,ω)=ω2πσ1exp{(xμ1)2/2σ12}+1ω2πσ2exp{(xμ2)2/2σ22}
该分布有五个参数,受四个方程约束
E[X]=ωμ1+(1ω)μ2var(X)=ωσ12+(1ω)σ22+ω(μ1E[X])2+(1ω)(μ2E[X])2E[X3]=E[X4]=
假设这些方程是兼容的,因此有无限数量的解(μ1,μ2,σ1,σ2,ω).

西安的回答证明(或至少暗示证明)存在具有相同均值、方差、偏度和峰度的不同分布。我只想展示一个具有相同矩的三个视觉上不同的离散分布的示例(均值 = 偏度 = 0,方差 = 1 和峰度 = 2):

三个具有相同矩的离散样本

生成它们的代码是:

library(moments)

n <- 1e6

x <- c(-sqrt(2), 0, +sqrt(2))
p <- c(1,2,1)
mostra1 <- sample(x, size=n, prob=p, replace=TRUE)

x <- c(-1.4629338416371, -0.350630832572269, 0.350630832573386, 1.46293384163564)
p <- c(1, 1.3, 1.3, 1)
mostra2 <- sample(x, size=n, prob=p, replace=TRUE)

x <- c(-1.5049621442915, -0.457635862316285, 0.457635862316022, 1.50496214429192)
p <- c(1, 1.6, 1.6, 1)
mostra3 <- sample(x, size=n, prob=p, replace=TRUE)

mostra <- rbind(data.frame(x=mostra1, grup="a"),
                data.frame(x=mostra2, grup="b"),
                data.frame(x=mostra3, grup="c"))
aggregate(x~grup, data=mostra, mean)
aggregate(x~grup, data=mostra, var)
aggregate(x~grup, data=mostra, skewness)
aggregate(x~grup, data=mostra, kurtosis)

library(ggplot2)
ggplot(mostra)+
  geom_histogram(aes(x, fill=grup), bins=100)