使用相关系数

机器算法验证 相关性
2022-04-15 19:17:51

我正在研究三个年龄组(即 21 至 30 岁、31 至 40 岁和 41 至 50 岁)的三个 Pearson 相关系数(.8978、.5676 和 .7865),我正在研究他们的购物习惯与体重的行为获得。

我可以说 .8978 是购物习惯和体重增加之间最强的关系吗?

根据系数的差异,我可以说三个年龄段的购物习惯和体重增加有差异吗?

最后,我可以将三个系数相加并除以三得出​​平均值吗?

所有这些都是“面值”的解释。它们是否可以接受,还是我需要进行某种统计分析?如果是后者(天禁),SPSS能做到吗?

2个回答

我可以说 .8978 是购物习惯和体重增加之间最强的关系吗?

描述性地,你可以说它是最强的关系。它是否明显强于其他两个取决于您的样本量。有一个在线计算器

根据系数的差异,我能说三个年龄段的购物习惯和体重增加有差异吗?

这与上面的统计问题相同。测试每对相关性的差异的显着性。当您执行三个测试时,您可能需要考虑修正水平。这里阐述的另一种可能性是将年龄组作为虚拟编码变量添加到回归分析中。α

最后,我可以将三个系数相加并除以三得出​​平均值吗?

不。要获得平均相关性,您必须进行转换(Fisher's),平均这些转换后的值,然后再次将平均反向转换为对于转换,有几个在线计算器rZZZr

平均相关系数是一个没有意义的操作。相关性是

ρ=Cov[X,Y]Var[X]Var[Y].
你甚至不能平均它的组成部分(协方差和两个方差),除非两个变量上所有组的均值相同。如果不是,则由于组间差异,您的总体方差/协方差将大于/不同于方差/协方差的(加权)总和。