机器算法验证 - 我应该使用平均值来总结序数数据吗？ - 吾爱随笔录

我应该使用平均值来总结序数数据吗？

机器算法验证意思是描述性统计

2022-04-10 23:37:10

我需要算出一个“平均”（因为不知道更好的词）评级，或者我可以称它们为标签。基本上，我有一个难度等级为 1 - 3 的单词列表。1容易，2中等，3困难。该列表由 5 个人标记。我需要使用“主要”评级为 2 的词。所以个人并不总是同意难度。如果一个词有以下“分数”：1、1、2、3、3，那么可以肯定地说它是 2。

如果大多数审稿人给一个词打3分，那显然不是平均2分。基本上，一个词取5个审稿人的打分，平均打分是多少？

现在我想把它全部加起来除以 5 是有道理的。这将主要给我十进制值，例如 1.6 左右。

现在我的问题终于来了。如果这样做，得到诸如 1.6 之类的值，我该怎么做？将其四舍五入到最接近的整数并将其作为决定性评级？就这么简单吗？

4个回答

这在很大程度上是一个问题，您可以根据您对数据的理论假设及其背后的内容来决定。当您计算算术平均值时，您假设区间相当相似。（也就是说，您暗示 $3-2 = 2-1$ 和 $3-1 = 2\times (3-2)$。）如果您认为这是一个合理的假设，并且您所在领域的其他人（例如，审稿人）可能会同意你的观点，那没关系。在以下情况下，对序数数据使用均值往往更合理：

有更多的序数级别（经验法则是 $\ge 12$）；
序数级别由许多组件组成（例如，许多相关问题的评分被汇总为一个组合）；和/或
评分者被指示/试图使评分等间隔。

我不清楚这些是否适用于您的情况，但由您决定。

您还应该认真考虑“主要”被评为 2 的含义。同样，这由您决定。但是，我不会认为 $\{1,1,2,3,3\}$ 的评级集“主要”是 $2$，尽管平均值是 $2$。我会将其解释为一个有点两极分化的词，有些人认为它“容易”，有些人认为它“难”。但同样，这是一个由您决定的理论问题。

对于它的价值（几乎可以肯定很少），如果是我，我会认为你的评级不适合用手段来描述。我想我会解释 '"主要" 被评为 2'，因为大多数评分者给这个词 2。也就是说，我会选择收到 $>50\%\ \rm ``2\!"$s 的单词。

相比之下，我怀疑您不仅要选择单个单词'“主要”被评为 2'，而且还希望整个选定单词的评级为 $\约 2$。为了检查这方面，我会觉得使用所有选定单词的所有评级的平均值（或单词的平均值）会更舒服。在这一点上，你正在平均更多的评级，我认为平均值会更合理。

对于离散数据，通常情况下均值是非离散的。这并不意味着它不是一个值得报告的统计数据。对于大多数人来说，1.6 的值可能被解释为容易，但对于某些人来说是中等的 - 几乎就是您在表格中看到的。

如果你想要整数，你可以计算中位数，即所有观察值的一半低于它，一半高于它的值。例如对于 kanarie，(1,1,2,2,2) 的中位数是 2，因为一半低于 2，一半高于（或等于）。

或者是模式，这只是最常见的值。了解总体人群的选择通常很有用。

您声明您“需要使用‘主要’标记为 2 的词。”

我认为您需要定义“主要”对您的实际意义。

一种方法是采用mean，因为您直观地表明对您有意义。如果你这样做，那么，确实，如果平均值是：1.5 ≤ mean < 2.5。那么您可能会将其解释为“主要” 2。

另一种方法是使用mode，正如@ssdecontrol 建议的那样。但是，您需要决定如何处理有两种模式的情况：例如(1,1,2,2,3)，模式是 1 和 2。您认为这符合您的标准吗？或者您(1,1,2,3,3)的模式为 1 和 3 的示例。在这种情况下，模式不是 2，但平均值正好是 2。它是否符合您的标准？

第三种选择是使用众数的平均值。通过标准可能是：1.5 ≤ mean of mode < 2.5.

我认为您有几个选择，具体取决于您关心的内容。您可以使用平均值，看看它是否在 2 的某个范围内。这就像平均您的选票。这里的好处是你可以检查人们的投票有多平衡。

如果您更关心选票如何在某个时候或多或少地获得至少 1/2 的选票，那么您会希望使用中位数。中位数的优势在于它更多地基于投票分布。

您可能对最多选民投票的地方感兴趣。这将是模式。您主要使用了这个词，因此您可能对这个指标感兴趣。优势是投票最多的地方，劣势是当您获得更多选择时，这可能意味着更少。

还要记住的一件事是，您可能会在大多数选民是 1 和 3 的情况下使用一些有争议的词。在这种情况下，您应该小心，因为大多数人不会说 2，但有些方法会给您 2。因此我建议您使用模式，在两种模式的情况下，您会拒绝或使用另一种方法，例如中位数。

e：您还可以查看 2 的选票百分比。如果高于 50%，那么主要人们认为问题是 2。

E：如果你真的想增加复杂性，你也可以尝试解决选民不同意和有偏见的问题。然后，您需要对投票进行一些转换并计算平均值/中位数。

其它你可能感兴趣的问题

上一篇残差分析：散点图的解释下一篇具有这种曲率的直方图的分布形状叫什么名字？