因子相关相关

机器算法验证 相关性
2022-04-12 04:44:55

如果我进行一组测量并测试变量与变量的相关性并获得显着的相关性,这对我来说很有意义。但是,如果进一步分析表明,在这些因素中,只有一个群体内存在显着的正相关,而该群体的比例过高。全局相关性是否仍然有效,或者在更详细的检查后是否存在样本偏差效应?AB

这里有一些图表来解释:

全局相关性

全局相关

组分离相关性

分组分离相关

3个回答

你熟悉辛普森悖论吗?这似乎就是您在这里观察到的。

编辑:我没有回答你的问题 :) 你到底应该做什么在某种程度上取决于上下文(这些组有意义吗?这是否代表研究设计中的问题?等)。至少你应该报告这两个结果 IMO。

我同意 JMS 的建议,答案完全取决于上下文。

但是你所看到的也可能被认为是一种适度的效果

在统计学中,当两个变量之间的关系取决于第三个变量时,就会出现调节。

(引自维基百科

如果在多元回归分析中预测变量与第三个变量的交互作用显着,则调节具有统计显着性。

之前的评论都很好,但是对于 5、7 和 11 组样本大小,我不会相信它们的任何相关性,只要我能抛出它们。您还需要给整体r一个宽置信区间。顺便说一句,在图表上做得很好。