我想对使用李克特量表的许多测量值进行相关性分析。查看散点图,似乎可能违反了线性和同方差的假设。
- 鉴于似乎围绕序数级别评级近似区间级别缩放存在一些争论,我应该安全地使用Spearman's Rho而不是Pearson's r吗?
- 如果我使用 Spearman 的 Rho,是否有可以引用的参考资料?
我想对使用李克特量表的许多测量值进行相关性分析。查看散点图,似乎可能违反了线性和同方差的假设。
相关问题已在此站点上多次询问。查看
根据我的经验,在 likert 项目上运行分析与 likert 量表之间存在差异。李克特量表是多个项目的总和。将多项相加后,李克特量表获得更多可能的值,得到的量表不那么粗糙。这样的尺度通常有足够数量的点,许多研究人员准备将它们视为连续的。当然,有些人会认为这有点漫不经心,并且在心理测量学中已经写了很多关于如何最好地测量心理和相关结构的文章。
根据我阅读心理学期刊文章的偶然观察,多项目李克特量表之间的大多数双变量关系是使用皮尔逊相关系数分析的。在这里,我正在考虑个性、智力、态度、幸福感等量表。如果您有这样的量表,则值得考虑将您的结果与以前的结果进行比较,其中 Pearson 可能是主要选择。
比较 Pearson 和 Spearman(甚至可能是 Kendall 的 tau)是一个有趣的练习。但是,您仍然需要决定使用哪个统计量,这最终取决于您对双变量关联的定义。
相关系数是两个变量之间线性关系的准确总结,即使在没有同方差性的情况下(或者我们应该说双变量正态性,因为这两个变量都不是因变量)。
如果您的两个变量之间存在非线性关系,这很有趣。但是,这两个变量仍然可以被视为连续变量,因此,您仍然可以使用 Pearson's。例如,年龄通常与收入等其他变量呈倒U型关系,但年龄仍然是一个连续变量。
我建议您制作散点图并拟合一些平滑拟合(例如样条曲线或 LOESS)来探索任何非线性关系。如果关系真的是非线性的,那么线性相关就不是描述这种关系的最佳选择。然后,您可能想要探索多项式或非线性回归。
您几乎可以肯定选择 Spearman 的 rho 或 Kendall 的 tau。通常,如果数据不正常但方差相等,您可以选择 Pearson's r,因为它不会产生很大的差异。如果方差显着不同,则需要非参数方法。
您可能可以引用几乎所有介绍性统计教科书来支持您使用 Spearman 的 Rho。
更新:如果违反了线性假设,那么您不应该在数据上使用 Pearson 相关系数,因为它假设线性关系。Spearman 的 Rho 在没有线性的情况下是可以接受的,并且适用于变量之间更一般的单调关系。如果您想使用 Pearson 的相关系数,您可以查看对数转换数据,因为这可能会处理非线性问题。
有一件事很确定,相关性通常需要线性关系。现在你说你的数据有点曲线形状,所以非线性回归似乎是左边的选择