相关性 = 0.2 是否意味着“只有五分之一的人”存在关联?
引用的段落确实不正确。相关系数量化了整个总体(或样本,在样本相关系数的情况下)的关联程度。它不会将人口分成几部分,一部分显示关联,另一部分不显示。可能的情况是总体实际上由具有不同关联程度的两个亚群组成,但仅相关系数并不意味着这一点。
不,0.2 并不意味着五分之一的人表现出相关性。我不知道他怎么能写出这样的废话。
这是 0.2 数字的来源:“关于身高-智力相关性的来源:来自具有分类交配的双变量 ACE 模型的新见解”,https: //www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/显然,相关性是稳健的。
我已经知道了:随着身高的增长,我的智商也随着身高的提高而显着提高。现在我知道为什么我不再变得更聪明了:我的身高稳定了。
当然,这是一个笑话,但它指出了那本“白痴”书作者论点的问题:没有人在身高和智商的相关性范围内进行测量,至少据我所知。我不知道你会如何干净地做到这一点,会有这么多的混乱。
话虽如此,研究人员正在使用诸如查看双胞胎内部以及家庭身高和智商相关性等技巧,这有助于他们解决令人困惑的问题。据推测,双胞胎在相似的环境中长大,具有相同的 DNA,因此在观察研究中它有助于解决内生性和其他问题。然而,如果你把这一切都放在一边,底线是“0.2 相关性”没有理由说废话,比如有些人有相关性,而另一些人则没有。这只是对相关性研究结果的荒谬解释。
声明中的讽刺意味几乎无法解析。鉴于文本的标题,我假设是有意开玩笑的。但是,如果直觉对任何事情都很重要,那么您说这是错误的“直觉”可能是正确的。不幸的是,很多科学报告在处理我们没有遇到的概念时都没有直觉。
有可能的是,当测量之间的关联时和, 之间的相关性和在 20% 的人口中为 1.0,在剩余的 80% 中为 0。净效应是总体相关性和为 0.2。我们一直在药物流行病学中看到这一点:如果平均而言有积极的益处,则实验药物被认为是“有效的”;许多普通流通中的药物,其中一些您可能正在服用,可能会因为与您的行为或遗传相互作用而伤害您,但实际上没有人知道这一点。
以上只是0.2相关性的一种可能解释;这是非常牵强的,因为生活中很少有事物具有 1 或 0 的相关性,并且很少有事物仍然具有足够强的效果修改以产生这种差异的相关性。
很难对此做出有意义的解释,更不用说正确了。关联不是单个数据点的属性。如果你只有一个人的身高和智力,你怎么可能说身高和智力是否相关?我想如果我们有身高和智力的平均值,我们可以说每个人都高于平均值,或者低于平均值,都表现出“关联”。但是如果你有完全随机的数据(没有相关性),你应该期望有一半的人在这个意义上表现出“关联”。我生成了一个相关性约为 0.2(实际上是 0.22)的随机数据集,并发现 55 在这个意义上显示了“关联”。
Y有可能是X的增函数,它们之间的相关性只有0.5;如果每个人的智商都比每个矮个子高,而智商比每个高个子低,那么说只有一半的人表现出关联是很愚蠢的。此外,理论上可能有一个异常值创建所有相关性,并且没有该点的集合的相关性为零。甚至可能有 20% 的总体呈负相关,而另外 80% 的总体也呈负相关,总相关为 0.2。