有哪些好的基本统计数据可用于序数数据?
我将从应用的角度论证,平均值通常是总结李克特项目集中趋势的最佳选择。具体来说,我正在考虑诸如学生满意度调查、市场研究规模、员工意见调查、性格测试项目和许多社会科学调查项目等背景。
在这种情况下,研究的消费者通常希望得到以下问题的答案:
- 哪些陈述相对于其他陈述或多或少一致?
- 哪些团体或多或少同意给定的声明?
- 随着时间的推移,协议是上升还是下降?
出于这些目的,均值有几个好处:
1.平均值容易计算:
- 很容易看出原始数据和平均值之间的关系。
- 这在实用上很容易计算。因此,平均值可以很容易地嵌入到报告系统中。
- 它还有助于跨上下文和设置的可比性。
2.均值比较好理解和直观:
- 平均值通常用于报告李克特项目的集中趋势。因此,研究的消费者更有可能理解平均值(并因此相信它并采取行动)。
- 可以说,一些研究人员更喜欢报告样本回答 4 或 5 的百分比的更直观的选项。即,它具有“百分比一致性”的相对直观的解释。本质上,这只是平均值的另一种形式,带有
0, 0, 0, 1, 1
编码。 - 此外,随着时间的推移,研究的消费者会建立参考框架。例如,当您逐年或跨学科比较您的教学表现时,您会对 3.7、3.9 或 4.1 的平均值产生细微的差别。
3.均值是一个数字:
- 当您想提出“学生对主题 X 比主题 Y 更满意”之类的声明时,单个数字特别有价值。
- 我还发现,凭经验,一个数字实际上是李克特项目中感兴趣的主要信息。标准差往往与平均值接近中心分数(例如,3.0)的程度有关。当然,根据经验,这可能不适用于您的上下文。例如,我在某处读到,当 You Tube 评分有星级系统时,有大量的最低或最高评分。因此,检查类别频率很重要。
4. 差别不大
- 虽然我没有正式测试过,但我假设为了比较项目、参与者组或随着时间的集中趋势评级,任何合理的缩放比例选择都会产生类似的结论。
频率表是一个很好的起点。您可以对每个级别进行计数和相对频率。此外,总计数和缺失值的数量可能是有用的。
您还可以使用列联表一次比较两个变量。也可以使用马赛克图显示。
对于基本摘要,我同意报告频率表和一些关于集中趋势的指示是好的。为了推断,最近发表在 PARE 上的一篇文章讨论了 t 与 MWW 检验、五点李克特项目:t 检验与 Mann-Whitney-Wilcoxon。
对于更详细的处理,我建议阅读 Agresti 关于有序分类变量的评论:
Liu, Y 和 Agresti, A (2005)。有序分类数据的分析:对近期发展的概述和调查。Sociedad de Estadística e Investigación Operativa Test , 14(1), 1-73。
它在很大程度上超出了通常的统计数据,如基于阈值的模型(例如比例优势比),值得一读,以代替 Agresti 的CDA书。
下面我展示了处理李克特项目的三种不同方法的图片;从上到下,“频率”(名义)视图、“数值”视图和“概率”视图(部分信用模型):
数据来自包中的Science
数据,ltm
项目涉及技术(“新技术不依赖于基础科学研究”,从“非常不同意”到“非常同意”,四分制)
常规做法是使用非参数统计秩和和平均秩来描述有序数据。
以下是它们的工作方式:
排名和
为每个组中的每个成员分配一个等级;
例如,假设您正在查看两个对立足球队的每个球员的进球数,然后将两支 球队的每个成员从第一个到最后一个排名;
通过添加每组的排名来计算排名和;
排名和的大小告诉您每个组的排名有多接近
平均排名
M/R 是比 R/S 更复杂的统计数据,因为它补偿了您正在比较的组中的大小不等。因此,除了上述步骤之外,您还可以将每个总和除以组中的成员数。
一旦你有了这两个统计数据,你就可以,例如,对秩和进行 z 检验,看看两组之间的差异是否具有统计显着性(我相信这被称为Wilcoxon 秩和检验,它是可互换的,即在功能上相当于 Mann-Whitney U 检验)。
这些统计数据的 R 函数(无论如何,我知道的那些):
标准 R 安装中的wilcox.test
曲柄包中的平均值