我提出了一个概念问题,我遇到了一个巨大的问题。
假设一家公司的分布高度偏斜。类似于指数或对数正态的东西只是更极端。现在假设分布如此偏斜,以至于分布的平均值高于分布的 99% 百分位数。(Aka 1-2极高的值导致平均值与其他分布相比非常高)。
根据定义,如果此分布用于预测未来值(也就是分布中的随机样本),那么平均值不会在 95% 预测区间内是真的吗?
在我的大脑中,95% 的预测区间是 95% 的未来值将落在其之间的范围。对于任何分布,这应该完全等于下限的 0.025 百分位数和上限的 0.975 百分位数……如果平均值高于 0.975 百分位数,则平均值不会在 '95% 范围内预测区间”。
我想错了吗?报告预测似乎很奇怪
- 平均预测值:6,000,0000
- 95% 预测区间:[400,5000]。