两个有序分类变量之间的相关性

机器算法验证 相关性 序数数据 关联度量
2022-03-14 14:59:36

调查两个分类变量之间是否存在相关性的最佳统计检验是什么?

两者都是满意度分数:

第一个变量是:

对服务总体满意。

1:完全不满意;10:完全满意

第二个变量是:

对服务信息可用性的满意度"

1:完全不满意;10:完全满意。

3个回答

对于分类(序数)变量,我会选择 Spearman rho 和/或 Kendall Tau。

与 Pearson 相关系数相关,Spearman 相关系数 (rho) 衡量两个变量之间的关系。Spearman 的 rho 可以理解为 Pearson 相关系数的基于等级的版本。

与 Spearman 的 rho 一样,Kendall 的 tau 测量变量之间单调关系的程度。粗略地说,Kendall 的 tau 与 Spearman 的 rho 的区别在于对非序列(在排名变量的上下文中)位错的更强惩罚。

这两个都有足够的水平,您可以将它们视为连续变量,并使用 Pearson 或 Spearman 相关性。然后,您可以根据相关性和样本量计算显着性 (p) 值。

如果您真的想将数据视为分类数据,则需要对总体满意度与可用性满意度的 10x10 矩阵进行卡方检验。为此,您将需要大量数据(约数千),因为大多数单元格应包含至少 5 个观察值才能使测试有效。这将允许两种度量之间存在更一般类型的依赖关系,其中即使是附近的级别也显示出不同的关系(例如 rating1=9 倾向于预测 rating2=4,rating1=8 倾向于预测 rating2=10),这在你的数据。