机器算法验证 - 两个有序分类变量之间的相关性 - 吾爱随笔录

两个有序分类变量之间的相关性

机器算法验证相关性序数数据关联度量

2022-03-14 14:59:36

调查两个分类变量之间是否存在相关性的最佳统计检验是什么？

两者都是满意度分数：

第一个变量是：

对服务总体满意。

1：完全不满意；10：完全满意

第二个变量是：

对服务信息可用性的满意度"

1：完全不满意；10：完全满意。

3个回答

对于分类（序数）变量，我会选择 Spearman rho 和/或 Kendall Tau。

与 Pearson 相关系数相关，Spearman 相关系数 (rho) 衡量两个变量之间的关系。Spearman 的 rho 可以理解为 Pearson 相关系数的基于等级的版本。

与 Spearman 的 rho 一样，Kendall 的 tau 测量变量之间单调关系的程度。粗略地说，Kendall 的 tau 与 Spearman 的 rho 的区别在于对非序列（在排名变量的上下文中）位错的更强惩罚。

这两个都有足够的水平，您可以将它们视为连续变量，并使用 Pearson 或 Spearman 相关性。然后，您可以根据相关性和样本量计算显着性 (p) 值。

如果您真的想将数据视为分类数据，则需要对总体满意度与可用性满意度的 10x10 矩阵进行卡方检验。为此，您将需要大量数据（约数千），因为大多数单元格应包含至少 5 个观察值才能使测试有效。这将允许两种度量之间存在更一般类型的依赖关系，其中即使是附近的级别也显示出不同的关系（例如 rating1=9 倾向于预测 rating2=4，rating1=8 倾向于预测 rating2=10），这在你的数据。

我去搜索它，从 John Ubersax 那里找到了这个：http: //www.john-uebersax.com/stat/tetra.htm

和一些论文

https://link.springer.com/article/10.1007/s11135-008-9190-y

https://escholarship.org/content/qt583610fv/qt583610fv.pdf

其它你可能感兴趣的问题

上一篇关于阅读列线图的说明下一篇倾向评分加权平均治疗效果的置信区间？