快速评估(视觉)R 中有序分类数据之间的相关性?

机器算法验证 r 相关性 分类数据 数据可视化
2022-03-17 00:34:45

我正在寻找调查中不同问题的答案之间的相关性(“嗯,让我们看看问题 11 的答案是否与问题 78 的答案相关”)。所有答案都是分类的(其中大多数的范围从“非常不开心”到“非常开心”),但有些答案的集合不同。它们中的大多数可以被认为是序数,所以让我们在这里考虑这种情况。

由于我无法访问商业统计程序,因此我必须使用 R。

我尝试了Rattle(一个免费的 R 数据挖掘包,非常漂亮),但不幸的是它不支持分类数据。我可以使用的一种技巧是在 R 中导入带有数字(1..5)而不是“非常不开心”......“开心”的调查编码版本,让 Rattle 相信它们是数字数据。

我正在考虑做一个散点图,并让点的大小与每对的数字数量成正比。经过一番谷歌搜索后,我发现http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/但它似乎非常复杂(对我来说)。

我不是统计学家(而是程序员),但在这方面有一些阅读,如果我理解正确,斯皮尔曼的 rho在这里是合适的。

所以对于那些匆忙的问题的简短版本:有没有办法在 R 中快速绘制 Spearman 的 rho绘图比数字矩阵更可取,因为它更容易观察,也可以包含在材料中。

先感谢您。

PS我考虑了一会儿是否将其发布在主SO站点或此处。在搜索了两个站点的 R 相关性之后,我觉得这个站点更适合这个问题。

2个回答

corrplot提供了另一个很好的相关性可视化,为您提供如下内容:替代文字

这是一个很棒的包裹。

也看看这里的答案,它可能对你有好处。

最后,如果您对您提到的帖子中的代码如何更简单有任何建议 - 请告诉我。

一些额外的绘图想法是: