如果我进行一组测量并测试变量与变量的相关性并获得显着的相关性,这对我来说很有意义。但是,如果进一步分析表明,在这些因素中,只有一个群体内存在显着的正相关,而该群体的比例过高。全局相关性是否仍然有效,或者在更详细的检查后是否存在样本偏差效应?
这里有一些图表来解释:
全局相关性
组分离相关性
如果我进行一组测量并测试变量与变量的相关性并获得显着的相关性,这对我来说很有意义。但是,如果进一步分析表明,在这些因素中,只有一个群体内存在显着的正相关,而该群体的比例过高。全局相关性是否仍然有效,或者在更详细的检查后是否存在样本偏差效应?
这里有一些图表来解释:
全局相关性
组分离相关性
你熟悉辛普森悖论吗?这似乎就是您在这里观察到的。
编辑:我没有回答你的问题 :) 你到底应该做什么在某种程度上取决于上下文(这些组有意义吗?这是否代表研究设计中的问题?等)。至少你应该报告这两个结果 IMO。
之前的评论都很好,但是对于 5、7 和 11 组样本大小,我不会相信它们的任何相关性,只要我能抛出它们。您还需要给整体r一个宽置信区间。顺便说一句,在图表上做得很好。