百分比可以平均吗?

机器算法验证 意思是
2022-04-05 01:43:13

我收到了两套由几个受试者执行的任务的时间安排:第一个使用方法 A,另一个使用方法 B。

实验者采用每种方法的平均时间,计算出改进百分比(例如,受试者 1 使用方法 A 平均花费 10 秒,使用方法 B 平均花费 5 秒,显示出 50% 的改进,而受试者 2 显示出 25% 的改进) ,然后平均这些百分比(即 (50% + 25%) / 2 = 使用方法 B 平均提高 37.5%)。

这是有效的吗?

3个回答

具体建议在这里很难。我们看不到任何数据,只能大致了解正在做什么。要回答的具体问题是什么?平均百分比通常不是一个好主意,但需要将问题扩大到更广泛的范围以提供好的建议。

例如,如果减少花费的时间是最重要的,那么以秒为单位的节省是关键。通常快的不能变得更快,但是如果有一些身体或心理技能对快速完成来说是必不可少的,但对某些人来说很难,那么慢的人仍然有很大的变慢空间。使用百分比可能会掩盖关键问题。

因此,首先要弄清楚百分比改进是否是一个很好的尺度,在此基础上一些一般性的建议是可能的。如果变化通常是乘法的,那么使用百分比是有意义的。因此,以百分比来讨论价格或收入的变化是有道理的,因为这是一个很好的近似值,即许多机构改变价格或收入的方式。这里有类似的吗?

完成任务的时间

  1. 往往是最好的分析,因为有科学的,特别是实际的,对时间的兴趣,因为它会被花费。

  2. 有时最好在对数尺度上进行分析,因为它们通常是高度偏斜的(想象一下跑 1 公里的时间,即使是那些可以跑的人)。使用对数刻度和百分比变化基本上是相同的想法。

  3. 有时最好在倒数范围内进行分析,因为这给出了速度或完成率。(未完成的人可以被认为是速度为零,这在抽象上是不讨人喜欢的,但使他们更容易绘制和平均。)

假设人 X 在 A 上从 10 秒变为 20 秒,在 B 上从 20 秒变为 10 秒。在一种情况下提高了 50%,在另一种情况下提高了 -100%。什么是适当的总结?很容易想象不同种类的变化会被平均到相同的平均百分比的情况,这充其量是没有帮助的,最坏的情况是高度混乱。但它们是否出现在数据集中?

从广义上讲,

  1. 任何被要求对此进行判断的人都应该始终可以访问原始数据,以便可以检查和修改任何减少。

  2. 如果两组改进百分比非常接近,那么这是平均的最佳基础,但即使这是真的,最好还是以任何方式呈现两组结果。这不应该占用更多空间,因为您可以使用相同的图表和表格。

  3. 您的示例可能是凭空出现的,但如果方法的百分比变化之间存在显着差异,您需要关注差异,而不是取平均值。

我非常同意尼克考克斯的回应,举一个必须谨慎的例子,一个只有两个成本中心的组织遵守特定标准,第一个案例的样本量是 10,第二个是 100 . 在第一种情况下,10 人中有 8 人可能合规,而在第二种情况下,100 人中只有 40 人可能合规。如果想知道成本中心之间的平均值是多少,那么答案是 60%,而如果想知道整个组织的平均值是多少,那么最好将基本数字聚合起来,即 48/110 44%。

如果受试者 1 从 10 秒到 5 秒(50% 改进),而受试者 2 从 10 秒到 7.5 秒(25% 改进),那么在这种情况下平均百分比并说平均改进约为 37.5 是有效的%。