知道为什么我们不在统计中使用有效数字吗?我们正在使用估计值,因此关于精度的规则不适用;)?
为什么我们不使用有效数字?
机器算法验证
报告
2022-02-10 14:33:28
4个回答
在某些领域(我在化学中了解到它们)使用有效数字来表示数字中存在的有意义的精确度。这也是统计学中的一个重要话题,所以事实上我们一直在报告——我们只是以不同的形式报告。具体来说,我们报告置信区间,它表示估计的精度水平(例如平均值)。
列出估计值的 95% CI 后,例如,您可以列出任意数量的均值数字,例如,这没有问题。事实上,统计学家 Andrew Gelman 建议您至少列出四个(2009, p. 4)。
限制在许多估计、p 值等中报告的位数的一个原因是基于感知。报告类似 p = 0.04872429 的结果意味着结果的精确度水平,这使得它们被认为更准确。
从本质上讲,在报告统计结果时使用大量数字会让人试图用不应有的权威来掩盖你的发现。
我认为这实际上取决于所需的置信水平,更少的显着性数字适用于 95%,而不是 99.999% 或更高,例如,欧洲核子研究中心用于他们的许多结果。
您是在谈论将您的数据四舍五入到一些有效数字还是四舍五入您的最终答案?如果您对数据进行四舍五入,您可能会遇到丢弃统计计算需要使用的噪声的情况。