解释内核密度图

机器算法验证 分布 密度函数 内核平滑
2022-03-04 07:42:50

我正在对线性模型进行仿真。我得到 1000 个结果并将结果放入密度图表中。我确实明白 xaxis 是因变量,yaxis 代表内核密度。Yaxis 是十进制数字,例如从 0 到 0.15 。我如何向其他用户解释这一点?模拟值有 15% 的可能性落在 x1 和 x2 之间?

这是我的模拟输出:

summary(s)

Model:  ls 
Number of simulations:  1000 

Values of X
  (Intercept)  Volume
1           1 1699992
attr(,"assign")
[1] 0 1

Expected Values: E(Y|X) 
    mean    sd    50% 2.5%  97.5%
1 12.305 2.638 12.231 7.03 17.512

在此处输入图像描述

2个回答

您可以将核密度估计视为平滑直方图。直方图受到以下事实的限制:它们本质上是离散的(通过 bin),因此更适合显示离散变量的数据,并且对 bin 大小非常敏感。

您实际使用核密度估计所做的是估计概率密度函数。这使得解释简单明了。所以曲线下的面积是 1,一个值在 x1 和 x2 之间的概率是这两个点之间的曲线下面积。

Y 值的数量将决定曲线的“分辨率”,因此如果假设每两个相邻 Y 点之间有一条直线,则可以计算出这两个点之间曲线下面积的近似值。

确定一个概率x价值P(xa<x<xb)

P(xa<x<xb)=ya+..+yb

结果会越准确y你拥有的价值观。

由于没有声誉对上述帖子发表评论......

表达方式P(xa<x<xb)=ya+...+yb,看起来不对。以区间 [0, 1.0] 上的均匀密度函数为例,然后根据上述情况,仅使用ya,yb任何间隔的概率都是 2。我认为张贴者试图指的是梯形规则