从平均值计算两个标准偏差时,我得到一个低于零的数字。这个可以吗?

机器算法验证 标准差
2022-03-29 16:33:03

我不是数学天才,所以请保持您的回答足够简单。我需要在今天晚些时候完成一门方法课程的统计筛选考试,而我正忙于练习测试中出现的一个主题。我得到的数据集参考了多个城市发生的凶杀案数量。该数据的范围是 0-5。当我将置信区间放在一起并从平均值计算出多达两个标准偏差时,我得到的低值是负数。显然你不能有负数的凶杀案。在计算与平均值相差两个标准差的置信区间时,我应该在零处显示低值还是应该实际显示负数?例如,如果 95% CI 导致计算结果为 -1.5 到 3,我会提出那个还是我会提出0到3?谢谢。

1个回答

在我看来,这个问题不太可能要求您从平均值计算数据的两个标准偏差- 特别是考虑到您的数据不太可能是对称的,更不可能是正态分布的(因为它们是离散的)。我看不出这个计算可以真正回答的有趣问题。

似乎更有可能要求您给出均值的置信区间这还涉及计算数据的标准差,但是然后您通过除以样本大小的平方来计算平均值的标准差,最后根据标准差构建置信区间。因此,此置信区间不太可能低于零(如果确实如此,您确实应该在零处截断)。请注意,随着样本量的增加,均值的抽样分布将大致呈正态分布,这就是为什么这个区间实际上回答了一个有趣的问题,即我们期望实际均值在哪里。