当变量受其他变量影响但没有任何相关性时,我能得到什么结论?

数据挖掘 统计数据 相关性 方差分析 探索性因素分析
2022-03-05 08:27:43

我正在做一个分析性探索性分析。

如果目标是一个连续变量并且属性都是分类的(离散值),为了知道每个属性是否对目标有任何影响,我正在做这样的 ANOVA 测试:

fvalue, pvalue = stats.f_oneway(df[y], df[x])
pvalue < 0.5

如果该条件为真,则变量之间存在依赖关系。

对于所有变量,我都得到了 ANOVA 的真正依赖性,但相关值在 -0.1 和 0.2 之间。

我能用这个得出什么样的结论?

我可以说,例如,如果在具有负相关性的变量中,我获得新值以使该相关性成为高正值,那么目标将获得更高的值吗?

有任何想法吗?

1个回答

首先,因为您的目标值是连续的,所以这是一个回归问题。

如果相关性没有给出所需的值,则意味着变量和目标变量之间不存在线性关系,您应该研究互信息。

此外,在解释关系时,应注意不要混淆相关性和因果关系,因为虽然相关性表明两个变量之间存在关系,但它并不自动暗示一个导致另一个。

因此,如果您增加值以获得该变量与目标的正相关,它可能不一定会增加,因为可能存在混杂因素。

相互信息与相关性