有两个相互依赖的变量——经验和乐趣。使用相关性,我们只能说乐趣和体验是如何相关的,以及关系的强度。我的问题是如何检查(i)乐趣是否影响体验或(ii)体验是否影响乐趣?我不清楚应该如何使用 Pearson 相关性来指示方向箭头。
相关方向
我相信皮尔逊相关性无法告诉您关系的“方向”。
皮尔逊相关性本质上是寻找一个变量与另一个变量以某种方式变化的趋势,但不能以这种方式建立因果关系。
例如,有很多乐趣可能会让某人获得很多新体验(所以乐趣正在影响体验)。当你发现爱好时,生活经验也可能让人们享受更多的东西(所以经验会影响乐趣)。甚至两者的混合也是合理的,或者第三个变量在起作用(也许有钱人有更多的经验和更多的乐趣,但乐趣和经验之间根本没有因果关系)。
我认为通常情况下,如果不对您认为变量如何相互作用做出几个可能相当复杂的假设,建立因果关系将需要一个实验设计(或者如果这不可能,一个准实验设计)。相关性研究无法为您提供此类信息,这就是为什么我们必须进行大量实验而不仅仅是在各处挖掘相关性的原因。
简短的回答是您不能使用 Pearson 相关性来确定因果关系。这与俗话说的因果关系意味着相关性直接相关,反之则不然。
给出一个理由,我认为最好将 Wilk 的 lambda 视为显着性检验。简而言之,Wilk 的 lambda 可以用作两个多元随机向量之间相关性的显着性检验。假设你有两个随机向量和,每个都包含分别量化“乐趣”和“体验”的特征。问题是我们是否可以倒退给定. 为了解决这个问题,可以使用几个多变量测试来测量两个随机向量之间的“关联”或关系和 (Kshisargar 1972)。Wilk 检验(称为 Wilk 的 lambda)与
完全由之间的相关系数决定和, 在哪里是向量之间的样本相关系数和. 给定相同数量的观察值,可以使用典型相关分析计算样本相关系数和. 的分布确定它的可能性有多大可用于回归. 或者,我们是否选择使用作为回归者,本来是一样的,因为样本相关系数(和相关系数)是对称的和. 因此,无论你多么确定可以引起(就相关性而言),您同样确定可以引起.
您始终必须记住,相关性不是因果关系!没有相关系数会告诉您变量的因果关系。您可以识别因果关系的唯一方法可能是使用滞后变量(如果您有时间序列数据)运行线性回归,并查看似乎可以根据时间预测另一个变量。否则只有逻辑推理会有所帮助。
https://en.wikipedia.org/wiki/Correlation_does_not_imply_causation