机器算法验证 - 如何正确评估序数变量和连续变量之间的相关性？ - 吾爱随笔录

机器算法验证相关性序数数据斯皮尔曼罗连续数据

2022-02-10 18:27:43

我想估计以下之间的相关性：

一个序数变量：要求受试者以 1-5 的等级评价他们对 6 种水果的偏好（范围从非常恶心到非常好吃）受试者平均只使用 3 分。

一个连续变量：要求相同的受试者快速识别这些水果，这导致 6 种水果的平均准确度。

Spearman rho 是分析这些数据的最佳方法和/或我可以考虑其他好的方法吗？

2个回答

您可以使用 Spearman's，它基于等级，因此适用于序数数据。然后你会得到六个结果。

如果您想采用不同的方法，您可能会变得复杂并查看多级模型，并重复主题。听起来“准确性”取决于“偏好”。因此，混合模型可以考虑这一点并解释数据的非独立性。但是，如前所述，这是一个更复杂的模型来实现。

根据本文* “关联措施：如何选择？” （doi:10.1177/8756479308317006 ），如果您的序数变量中的项目数较低（<5 或 <6 ...这有点随意），您应该考虑kendall 的 tau-b 。

如果您的序数变量中有大量项目，则 Spearman 相关性会很好。

*论文可能在付费墙后面。但我试图在我的帖子中总结本质。

其它你可能感兴趣的问题