使用百分比表示数据时,有小数位是件好事吗,比如 2 个小数位而不是四舍五入到整数?
例如,不是 23.43%,而是四舍五入到 23%。
我从 2 位小数精度是否会产生很大差异的角度来看待这一点,因为我们处理的是百分比而不是原始数据值。
使用百分比表示数据时,有小数位是件好事吗,比如 2 个小数位而不是四舍五入到整数?
例如,不是 23.43%,而是四舍五入到 23%。
我从 2 位小数精度是否会产生很大差异的角度来看待这一点,因为我们处理的是百分比而不是原始数据值。
这取决于类之间差异的大小。在大多数应用中,说 73% 的人更喜欢选项 A 和 27% 的人喜欢选项 B 是完全可以接受的。但是,如果您正在进行的选举中,候选人 X 拥有 50.15% 的选票,而候选人 Y 拥有 49.86% 的选票,那么小数位是非常必要的。
当然,您需要注意确保所有类加起来达到 100%。在我上面的选举示例中,它们加起来为 100.01%。在这种情况下,您甚至可以考虑添加第三个小数位。
不同的组织在结果报告的准确性方面经常有相互冲突的规则。最终,在看到额外数字有用与不必要和过度精确“可能淹没读者,使故事过于复杂并掩盖信息”的情况之间进行权衡 - Tim Cole (2015) 在一篇文章中探讨了一个主题我发现它为报告中的“合理”精确度提供了有用的指南,并比较了领先的风格手册。他对百分比的建议如下:
整数,或 10% 以下的小数点后一位。如果补码信息丰富,超过 90% 的值可能需要一位小数。仅当值的范围小于 0.1% 时才使用两个或多个小数位
示例:0.1%、5.3%、27%、89%、99.6%
通过“补充”,他指的是人们可能对“其他批次”感兴趣的情况,例如,如果我告诉你试验中 98% 的患者好转,你很可能对 2% 没有好转的患者感兴趣,并且在这种情况下,另一个小数位来区分“2%”是否真的意味着“2.4%”或“1.6%”实际上是有用的。
参考
科尔,TJ(2015)。数字过多:数字数据的表示。 儿童疾病档案,100 (7), 608-609。http://dx.doi.org/10.1136/archdischild-2014-307149
这是一个重要的数字问题,取决于百分比背后数字的精确度。技术上正确的有效数字数量不取决于下游使用或百分比值之间的差异。
如果您试图表达一个描述 7 个项目中的 5 个项目的百分比,那么声称它是 71.4285714285% 是荒谬的——您根本没有精确度来支持所有这些小数位。在进行除法时,您的答案应该在起始数字中包含尽可能多的有效数字和最少数量的 sig figs。在这里,您只有 1 个有效数字,因此百分比实际上应该只是 70%,甚至不是 71%。如果你有另一个例子,你想表达 100000 中的 71428 个项目,那么你有理由使用更高的有效数字,一直到 71.428%。
即使您有很高的精度,通常最好截断以提高可读性。根据您的域,添加这两个额外的小数位可能会或可能不会有所作为。您永远不应该过度报告重要数字,但如果您的统计精度高于您的应用程序所需的数据,您可能有理由低估它们。