这在很大程度上是一个问题,您可以根据您对数据的理论假设及其背后的内容来决定。当您计算算术平均值时,您假设区间相当相似。(也就是说,您暗示 $3-2 = 2-1$ 和 $3-1 = 2\times (3-2)$。)如果您认为这是一个合理的假设,并且您所在领域的其他人(例如,审稿人)可能会同意你的观点,那没关系。在以下情况下,对序数数据使用均值往往更合理:
- 有更多的序数级别(经验法则是 $\ge 12$);
- 序数级别由许多组件组成(例如,许多相关问题的评分被汇总为一个组合);和/或
- 评分者被指示/试图使评分等间隔。
我不清楚这些是否适用于您的情况,但由您决定。
您还应该认真考虑“主要”被评为 2 的含义。同样,这由您决定。但是,我不会认为 $\{1,1,2,3,3\}$ 的评级集“主要”是 $2$,尽管平均值是 $2$。我会将其解释为一个有点两极分化的词,有些人认为它“容易”,有些人认为它“难”。但同样,这是一个由您决定的理论问题。
对于它的价值(几乎可以肯定很少),如果是我,我会认为你的评级不适合用手段来描述。我想我会解释 '"主要" 被评为 2',因为大多数评分者给这个词 2。也就是说,我会选择收到 $>50\%\ \rm ``2\!"$s 的单词。
相比之下,我怀疑您不仅要选择单个单词'“主要”被评为 2',而且还希望整个选定单词的评级为 $\约 2$。为了检查这方面,我会觉得使用所有选定单词的所有评级的平均值(或单词的平均值)会更舒服。在这一点上,你正在平均更多的评级,我认为平均值会更合理。