如何正确评估序数变量和连续变量之间的相关性?

机器算法验证 相关性 序数数据 斯皮尔曼罗 连续数据
2022-02-10 18:27:43

我想估计以下之间的相关性:

一个序数变量:要求受试者以 1-5 的等级评价他们对 6 种水果的偏好(范围从非常恶心到非常好吃) 受试者平均只使用 3 分。

一个连续变量:要求相同的受试者快速识别这些水果,这导致 6 种水果的平均准确度。

Spearman rho 是分析这些数据的最佳方法和/或我可以考虑其他好的方法吗?

2个回答

您可以使用 Spearman's,它基于等级,因此适用于序数数据。然后你会得到六个结果。

如果您想采用不同的方法,您可能会变得复杂并查看多级模型,并重复主题。听起来“准确性”取决于“偏好”。因此,混合模型可以考虑这一点并解释数据的非独立性。但是,如前所述,这是一个更复杂的模型来实现。

根据本文* “关联措施:如何选择?” doi:10.1177/8756479308317006 ),如果您的序数变量中的项目数较低(<5 或 <6 ...这有点随意),您应该考虑kendall 的 tau-b 。

如果您的序数变量中有大量项目,则 Spearman 相关性会很好。

*论文可能在付费墙后面。但我试图在我的帖子中总结本质。