上/下标准误差有意义吗?

机器算法验证 标准错误
2022-03-29 05:57:02

在给定的图像中,您可以看到上下两侧都有不同长度的误差线。通过计算平均值的standard error一次和 的一次来生成条形图all points abovethose below

http://i.stack.imgur.com/cVlJg.png

由于有关此“方法”的信息非常稀少,我问自己使用它们是否正确。或者它只是我使用的错误术语(下/上标准错误)?最后它们的含义是什么?

2个回答

可以将它们称为误差线,但由于它们是不对称的,它们并不代表标准误差,因此谈论“下/上标准误差”是不正确的。

我假设这里的误差线代表置信区间,尽管如果它们是使用贝叶斯方法构建的,它们也可能是可信区间。

很难确定你是否不打算告诉我们你从哪里得到这张图。

根据您更新的问题,@onestop 的声明仍然有效:不能称它们为标准错误。此外,该方法看起来很奇怪且不标准。在你的情况下真正做的是把人口分成两部分(高于和低于平均值的值)并计算那个人口的标准误差,而不是你的真实人口,因此,我个人觉得分配长度很奇怪以这种方式的误差线。显然,这里所做的想法是从这里得到的。但是,恕我直言,划分样本并计算“上下”标准偏差的想法没有多大意义(或者至少它让我感到困扰)。

然而,在物理学(我所在的领域,显然是您的领域)中,显示样本中位数或均值的 68% 置信区间(取决于您选择的位置统计数据;我们称其为统计数据)在某种程度上是标准的X¯目前)以下列方式用于非对称分布(显然模拟中央可信区间):使用您的数据点,您计算X¯然后报告长度的上误差条Lu, 在哪里Lu计算以满足P(X¯<μ<X¯+Lu)=0.34, 在哪里μ是真实(未知)参数。然后,对于您的较低长度误差条Ll,您重复相同的过程,但现在在位置统计信息的下方X¯, IE,P(X¯Ll<μ<X¯)=0.34. 当然,因为分布X¯通常不知道这通常使用非参数方法(例如 Bootstrap 或它的一些变体)来完成。

正如@onestop 也指出的那样,您还可以获得贝叶斯可信区间,您可以在其中实际计算给定数据的参数的概率(密度,在连续情况下)我们称这个概率为p(x|D). 现在以更“自然的方式”(至少对我而言)计算下误差条的长度,以满足P(x^Ll<x<x^|D)=0.34,现在计算上误差条的长度以满足P(x^<x<x^+Lu|D)=0.34, 在哪里x^是您对参数的点估计(通常是中位数甚至众数)。

当然,只有当您的参数是单峰时,上述所有内容才有意义。