我已经阅读了该站点中的所有页面,试图找到我的问题的答案,但似乎没有人适合我……
首先,我向您解释我正在使用的数据类型......
假设我有一个数组向量,其中包含多个城市名称,300 个用户每人一个。我还有另一个数组向量,其中包含对每个用户的调查的分数响应或每个用户的连续值。
我想知道是否存在计算这两个变量之间相关性的相关系数,因此,在名义变量和数字/连续或有序变量之间。
我在互联网上搜索过,在某些页面中,他们建议使用 contingency coefficient 或 Cramer's V 或 Lambda 系数或 Eta 。对于每一个测量值,只要说它们可以应用于我们有名义变量和区间或数值变量的数据。问题是搜索和搜索,试图理解它们中的每一个,有时会写或看例子,如果你有二分名义变量,它们是合理的,除了Cramer's V,其他时候没有写任何要求数据的类型。许多其他页面说应用回归是正确的,这是正确的,但我只是想知道这种数据是否存在像 pearson/spearman 这样的系数。
我也认为使用 Spearman Correlation coeff 不太合适,因为城市不可排序。
我还自己构建了 Cramer'sV 和 Eta 的函数(我正在使用 Matlab)但是对于 Eta,他们没有谈论任何 p 值来查看系数是否具有统计显着性......
在 matlabWorks 站点中,还有一个不错的工具箱,上面写着要计算 eta^2,但它需要的输入类型是无法理解的。
这里有像我一样做过测试的人吗?如果您需要更多详细信息来了解我正在使用的数据类型,请询问我,我会尽力为您解释得更好。