我想评估一个 7 类序数变量 (X) 与许多其他变量之间的相关性,其中一些是具有 3-6 个类别的序数,其他是连续的,还有一些是二分的。该数据集仅包含 24 个观测值,因此缺乏正态性和相关观测值是需要考虑的问题。
- 是否最好使用 Kendall 系数来评估 X 与其他每个变量之间的相关性?如果是这样,是哪一个(即 tau-a 或 tau-b;我知道 Roger Newson 偏爱前者)?
- 也使用 Spearman 是否合理?
- 评估与每个二分变量的相关性的最佳测试是什么?
我想评估一个 7 类序数变量 (X) 与许多其他变量之间的相关性,其中一些是具有 3-6 个类别的序数,其他是连续的,还有一些是二分的。该数据集仅包含 24 个观测值,因此缺乏正态性和相关观测值是需要考虑的问题。
而不是其中任何一个,我会使用专为这种情况设计的 Polychoric 相关性。他们使用最大似然来拟合每个有序变量下的潜在正态分布连续变量的模型;然后计算连续变量的相关系数。R 和 Stata 中提供了一些实现。