r2= 35 %r2=35% ,(专业)统计学家如何正式解释这种相关性?强的?虚弱的?r = 0.59r=0.59

机器算法验证 回归 相关性
2022-04-17 19:54:41

为了好玩和消遣,您想知道课程 101 中学生的成绩如何能预测课程 102 中的分数。因此,您对两个课程的成绩进行回归。

如果你得到一个 r = .59 且 = 35%,你认为这是强还是弱?除了结论之外,你能说什么吗?“显然存在关联,但也有其他变量在起作用。” r2

最重要的是,考虑到 r=.59 的重要性有多大?如果 102 成绩的 32% 被 101 成绩“解释”,这似乎是一个不平凡的因素。

TL;DR:专业统计学家如何正式解释 r=.59 和 =35% ?r2

3个回答

如果您盲目地应用Cohen 的标准来描述相关强度,则 r = .59 将被描述为已观察到的“大”效应。

但是,您应该注意,这种“大”效应实际上可能没有统计学意义,甚至没有意义。对于前一个论点,如果您查看相关系数的临界值,则需要超过 9 个自由度才能使其在时具有“统计显着性” 。对于后者,您应该查看散点图并真正查看分数是如何下降的——就像上面提到的评论者一样,这种关系可能不是线性的或有用的。α<.05

当然,如果线性关系看起来确实成立并且您具有相关性,您还可以生成线性回归方程以根据某人的 101 成绩预测其 102 成绩。但是,正如内斯特所说,这并不意味着他们的 101 成绩导致了他们的 102 成绩。

什么被认为是强项和弱项往往在学科之间存在很大差异,这是有充分理由的。从您的领域中考虑到被认为非常强的相关性会有所帮助。在我的情况下,这将是配偶教育年限的相关性(约 0.60)。这为相关性“强”的说法提供了更多的实质:两个相关班级的成绩之间的相关性与两个配偶的教育年限之间的相关性一样强。

在没有实际看到情节的情况下,“专业”统计学家不会费心将其解释为“强”或“弱”相关性,因为正如您所说,您似乎在暗示因果关系。请记住,依赖性有时意味着(线性,在您指的是由线性拟合给出的的情况下)相关性,但不是相反:相关性并不意味着因果关系r2