我有两组数据,其中 78 个和 35 个样本的值约为 250.000。一些样本是一个家庭的成员,这可能会影响数据。我已经计算了成对相关性,它在 0.7 和 0.95 之间变化,但我想知道家庭内部和家庭之间的相关系数是否存在显着差异?做这个的最好方式是什么?谢谢
比较相关系数
机器算法验证
相关性
互相关
类内相关
2022-03-11 01:00:43
2个回答
比较两个相关系数的一般方法是使用 Fisher 的 z 变换方法,即与平均值和标准差近似正常。如果样本是独立的,那么您转换每个相关系数,并且两个转换后的相关之间的差异将是正常的,平均值为和标准差。由此,您可以形成统计量并像在普通的两样本测试中一样进行测试。
尽管@Macro 的答案很好,但它确实需要对统计数据的(不)依赖性进行假设。另一种方法是使用自举。这个想法是保持一个变量固定并打乱另一个变量,计算每个样本的相关性,并获取它们的差异。重复多次以获得一个分布,并使用该分布来检验相关性相同的假设。你的数据集的结构对我来说不是很清楚,所以很难提供更多细节。