我正在查看变量之间的线性关联和带有一些控制变量
一种方法是进行回归看看.
另一种方法是计算偏相关
我的第一个问题是哪个更合适?(补充:从评论来看,它们是等效的但不同的演示文稿)
对于多元正态, 偏相关将是一个更好的选择,因为它的价值可以告诉我们有多好和关联,例如可以解释为和控制后具有完美的线性关系.
如果有的话怎么样是分类的吗?偏相关是否仍然适合衡量之间的关联和控制的?(补充:通过将分类变量更改为虚拟变量然后对其进行控制是可以接受的,就像我们在回归中处理它们的方式一样)。当我学习偏相关时,它被用于多元正态分布变量;我不确定当违反数据的正态性(例如,高度偏斜)甚至连续性不是这种情况(例如,我们的控制变量之一是“出生地”)时,它是否仍然合适和有意义。偏相关的计算和控制涉及皮尔逊相关和当是分类的,这使得看起来很奇怪。
此外,是否有任何稳健版本的偏相关(如肯德尔的/Spearman 等级相关性与 Pearson 相关性)?
从 ssdecontrol 引发:回归对分类预测变量“有效”且“有意义”,但相关性有时被认为不适用于分类数据。由于回归是偏相关的,我们有一个明显的悖论。
谢谢。