我有某个信号的注册幅度最大值的样本总体。人口约为 1500 万个样本。我制作了人口的直方图,但无法用这样的直方图猜测分布。
EDIT1:带有原始样本值的文件在这里:原始数据
任何人都可以使用以下直方图帮助估计分布:
我有某个信号的注册幅度最大值的样本总体。人口约为 1500 万个样本。我制作了人口的直方图,但无法用这样的直方图猜测分布。
EDIT1:带有原始样本值的文件在这里:原始数据
任何人都可以使用以下直方图帮助估计分布:
使用 fitdistrplus:
这是 fitdistrplus 的CRAN 链接。
这是 fitdistrplus 的旧小插图链接。
如果小插图链接不起作用,请搜索“使用库 fitdistrplus 指定数据分布”。
小插图很好地解释了如何使用这个包。您可以查看各种分布如何在短时间内适应。它还生成一个 Cullen/Frey 图。
#Example from the vignette
library(fitdistrplus)
x1 <- c(6.4, 13.3, 4.1, 1.3, 14.1, 10.6, 9.9, 9.6, 15.3, 22.1, 13.4, 13.2, 8.4, 6.3, 8.9, 5.2, 10.9, 14.4)
plotdist(x1)
descdist(x1)
f1g <- fitdist(x1, "gamma")
plot(f1g)
summary(f1g)
人口约为 1500 万个样本。
然后,您很可能能够拒绝简单、封闭形式的任何特定分布。
即使是图表左侧的那个微小凸起也可能足以让我们说“显然不是这样那样”。
另一方面,它可能很好地近似于一些常见的分布;明显的候选者是对数正态和伽马之类的东西,但还有很多其他的。如果您查看 x 变量的对数,您可能可以确定对数正态是否正常(获取对数后,直方图应该看起来是对称的)。
如果对数左偏,请考虑 Gamma 是否可以,如果是右偏,请考虑逆 Gamma 或(甚至更偏斜的)逆高斯是否可以。但是这个练习更多的是找到一个足够接近的分布。这些建议实际上都没有似乎存在的所有功能。
如果你有任何理论来支持一个选择,扔掉所有这些讨论并使用它。
我不确定您为什么要将样本分类为具有如此大样本量的特定分布;简约,将其与另一个样本进行比较,寻找参数的物理解释?
大多数统计软件包(R、SAS、Minitab)允许人们在图表上绘制数据,如果数据来自特定分布,则该图表会产生一条直线。如果数据正常(对数正常-对数转换后),我已经看到产生一条直线的图表,威布尔和卡方立即出现。这种技术将允许您查看异常值,并让您可以指定数据点为何是异常值的原因。在 R 中,正态概率图称为 qqnorm。