如何在给定 z 值的情况下找到置信水平

数据挖掘 r Python 统计数据
2021-10-14 20:11:17

我有一个任务,我想从中找到给定 z 值的置信水平。我有一个样本人口。从该总体中,鉴于其分布,我想找到该总体给定值的置信水平。换句话说,给定总体的 a 值,我想知道它是在整个总体的 95%(置信水平)内还是在 68% 或 50% 之内等等。通常,我们可以找到 z 值和置信区间以及给定的置信水平,如此处所述如何找到置信区间但我想找到给定 z 值的置信水平(在这种情况下,它是来自总体的给定值)。

我该如何解决这个问题?如果可能的话,它应该在 python 或 R 中

2个回答

好的,对于 95% 的置信区间,您想知道与您的点估计的平均值相差多少标准差(“z 分数”)。要做到这一点,你需要去掉 5% 的“尾巴”。以百分位数形式工作,您有 100-95,它产生的值为 5,或十进制形式的 0.05。

将其分成两半得到 0.025,然后在 R 中,使用 qnorm 函数得到 z 星(“临界值”)。因为你只关心曲线的一个“边”(两边的值是彼此的镜像)并且你想要一个正数,所以传递参数lower.tail=FALSE。

所以,最后,它看起来像这样:

qnorm(.025,lower.tail=FALSE)

产生 1.959964 的值

然后,您将该值代入等式中,以获得误差幅度来完成任务。

如果您想从“临界值”变为概率,请使用 pnorm 函数。就像是:

pnorm(1.959964,lower.tail=FALSE)

这会给你 0.025

要使用 python 在 z 分数和置信度值之间进行转换,请使用scipy.stats.normcdf中的andppf函数

有一个很好的例子说明如何在这个问题的答案中使用它们。