置信区间与标准差

机器算法验证 置信区间 标准差
2022-01-27 03:38:36

95% 的置信区间为您提供了一个范围。

标准差的 2 sigma 也为您提供了约 95% 的范围。

有人可以阐明它们的不同之处吗?

3个回答

这里有两件事:

  1. sigma 指标准偏差的“2 sigma 规则”是一种为正态分布数据构建容差区间的方法,而不是置信区间(请参阅此链接以了解差异)。简而言之,容忍区间是指总体内部的分布,而置信区间是指关于估计的确定性程度。

  2. 如果您的意思是标准误差而不是标准偏差(这是我最初理解的),那么如果您的数据是正态分布的(例如,如果中央限制的条件定理适用并且您的样本量足够大)。

可能会更容易解释,以避免混淆。

标准差:以大约 95% 的概率,我们会在区间 (x_mean - 2 * sigma; x_mean + 2 * sigma) 中找到每个新样本,这说明了我们预期新样本的位置。

置信区间:在 fe 95% 的概率下,将在区间 (x_mean - x_ci; x_mean + x_ci) 中找到真正的 x_mean 值,这向我们展示了测量的质量。

“x_ci”和“2 * sigma”是两个不同的值,因为对应两个不同的期望。x_ci = t * sigma / sqrt(n),其中 t 是根据所用理论的乘数。

这个方程依赖于误差是高斯的假设。此外,SE(β1) 项前面的因子 2 将根据线性回归中的观察数 n 略有不同。准确地说,方程应该包含自由度为 n-2 的 t 分布的 97.5% 分位数,而不是数字 2。