核密度图中的 y 轴是什么意思?

机器算法验证 r 分布 密度函数 内核平滑
2022-01-31 12:33:30

可能重复:
概率分布值超过 1 可以吗?

我认为密度函数曲线下的面积表示在 x 值范围内获得 x 值的概率,但是当我使带宽变小时,y 轴如何大于 1?请参阅此 R 图:

range <- seq(2,6,.01)
n <- 1000
d <- sample(range,n, replace=TRUE)
d <- c(d,rep(0,100))
d <- c(d,rep(1,50))
df <- data.frame(counts=d)
adjust <- 1/20
dens <- density(d,adjust=adjust)
plot(dens)

在此处输入图像描述

此外,获得的概率P(x<2)=1501000=.15,我怎么能在情节中看到这个?

1个回答

你是对的

密度函数曲线下的面积表示在 x 值范围内得到 x 值的概率

但请记住,面积不仅仅是高度:宽度也很重要。因此,如果您在 0 处有一个尖峰,如果宽度非常小(例如 0.1),那么高度可能会比 1 高很多(如果尖峰是完美的矩形,则最高为 10,因为0.1×10=1) 不违反任何概率规则。尖刺的高度很大,但尖刺下方的面积仍然很小。

出于同样的原因,连续随机变量的密度函数可以具有大于 1 的值。例如,如果您绘制 Normal(0,0.0001) pdf,您会发现峰值非常高。

我最初错过了你的第二个问题,但是P(x<2)=1501000=.15表示曲线下 2 左侧的面积(即 0 和 1 处的两个尖峰的面积,或多或少)为 0.15。