我应该使用平均值来总结序数数据吗?

机器算法验证 意思是 描述性统计
2022-04-10 23:37:10

我需要算出一个“平均”(因为不知道更好的词)评级,或者我可以称它们为标签。基本上,我有一个难度等级为 1 - 3 的单词列表。1容易,2中等,3困难。该列表由 5 个人标记。我需要使用“主要”评级为 2 的词。所以个人并不总是同意难度。如果一个词有以下“分数”:1、1、2、3、3,那么可以肯定地说它是 2。

数据示例

如果大多数审稿人给一个词打3分,那显然不是平均2分。基本上,一个词取5个审稿人的打分,平均打分是多少?

现在我想把它全部加起来除以 5 是有道理的。这将主要给我十进制值,例如 1.6 左右。

现在我的问题终于来了。如果这样做,得到诸如 1.6 之类的值,我该怎么做?将其四舍五入到最接近的整数并将其作为决定性评级?就这么简单吗?

4个回答

这在很大程度上是一个问题,您可以根据您对数据的理论假设及其背后的内容来决定。当您计算算术平均值时,您假设区间相当相似。(也就是说,您暗示 $3-2 = 2-1$ 和 $3-1 = 2\times (3-2)$。)如果认为这是一个合理的假设,并且您所在领域的其他人(例如,审稿人)可能会同意你的观点,那没关系。在以下情况下,对序数数据使用均值往往更合理:

  1. 有更多的序数级别(经验法则是 $\ge 12$);
  2. 序数级别由许多组件组成(例如,许多相关问题的评分被汇总为一个组合);和/或
  3. 评分者被指示/试图使评分等间隔。

我不清楚这些是否适用于您的情况,但由您决定。

您还应该认真考虑“主要”被评为 2 的含义。同样,这由您决定。但是,我不会认为 $\{1,1,2,3,3\}$ 的评级集“主要”是 $2$,尽管平均值是 $2$。我会将其解释为一个有点两极分化的词,有些人认为它“容易”,有些人认为它“难”。但同样,这是一个由您决定的理论问题。


对于它的价值(几乎可以肯定很少),如果是我,我会认为你的评级不适合用手段来描述。我想我会解释 '"主要" 被评为 2',因为大多数评分者给这个词 2也就是说,我会选择收到 $>50\%\ \rm ``2\!"$s 的单词。

相比之下,我怀疑您不仅要选择单个单词'“主要”被评为 2',而且还希望整个选定单词的评级为 $\约 2$。为了检查这方面,我会觉得使用所有选定单词的所有评级的平均值(或单词的平均值)会更舒服。在这一点上,你正在平均更多的评级,我认为平均值会更合理。

对于离散数据,通常情况下均值是非离散的。这并不意味着它不是一个值得报告的统计数据。对于大多数人来说,1.6 的值可能被解释为容易,但对于某些人来说是中等的 - 几乎就是您在表格中看到的。

如果你想要整数,你可以计算中位数,即所有观察值的一半低于它,一半高于它的值。例如对于 kanarie,(1,1,2,2,2) 的中位数是 2,因为一半低于 2,一半高于(或等于)。

或者是模式,这只是最常见的值。了解总体人群的选择通常很有用。

您声明您“需要使用‘主要’标记为 2 的词。”

我认为您需要定义“主要”对您的实际意义。

一种方法是采用mean,因为您直观地表明对您有意义。如果你这样做,那么,确实,如果平均值是:1.5 ≤ mean < 2.5那么您可能会将其解释为“主要” 2。

另一种方法是使用mode,正如@ssdecontrol 建议的那样。但是,您需要决定如何处理有两种模式的情况:例如(1,1,2,2,3),模式是 1 和 2。您认为这符合您的标准吗?或者您(1,1,2,3,3)的模式为 1 和 3 的示例。在这种情况下,模式不是 2,但平均值正好是 2。它是否符合您的标准?

第三种选择是使用众数的平均值。通过标准可能是:1.5 ≤ mean of mode < 2.5.

我认为您有几个选择,具体取决于您关心的内容。您可以使用平均值,看看它是否在 2 的某个范围内。这就像平均您的选票。这里的好处是你可以检查人们的投票有多平衡。

如果您更关心选票如何在某个时候或多或少地获得至少 1/2 的选票,那么您会希望使用中位数。中位数的优势在于它更多地基于投票分布。

您可能对最多选民投票的地方感兴趣。这将是模式。您主要使用了这个词,因此您可能对这个指标感兴趣。优势是投票最多的地方,劣势是当您获得更多选择时,这可能意味着更少。

还要记住的一件事是,您可能会在大多数选民是 1 和 3 的情况下使用一些有争议的词。在这种情况下,您应该小心,因为大多数人不会说 2,但有些方法会给您 2。因此我建议您使用模式,在两种模式的情况下,您会拒绝或使用另一种方法,例如中位数。

e:您还可以查看 2 的选票百分比。如果高于 50%,那么主要人们认为问题是 2。

E:如果你真的想增加复杂性,你也可以尝试解决选民不同意和有偏见的问题。然后,您需要对投票进行一些转换并计算平均值/中位数。