首先,我意识到多元回归并没有真正给出关于数据的“因果”推论。让我解释一下我目前的情况:
我有四个自变量,我希望(但不确定)参与驱动我正在测量的事物。我想使用多元回归来查看这些变量中的每一个对我的因变量有多少贡献,并且这样做了。据说,变量“第四号”对我的结果测量有很大的影响(β 权重接近 0.7)。
然而,有人告诉我这还不够,因为我的一些“独立”变量实际上可能相互关联。在那种情况下,我可以认为“变量四”正在驱动我的因变量,而实际上三和四的贡献是相等的。这似乎是正确的,但由于我是新手,所以我不确定。
以后如何系统地避免这个问题?在使用多元回归以确保您的“独立”数据不包含隐藏的相关性时,您会推荐哪些具体程序?
编辑:数据本身是特定神经状态的一系列网络(图)模型。我正在测量描述每个网络作为一个整体的拓扑结构的“聚类系数”(此处为因变量),然后查看较大的 100+ 网络中四个节点的单个连接是否正在驱动全局聚类值(四个独立的变量)。然而,这些节点是网络的一部分,所以从定义上看,它们可能在某种程度上是相关的。