多元响应回归与许多线性模型

机器算法验证 多元回归 直觉
2022-03-19 23:21:46

是否有人愿意冒险对多元响应模型比许多线性回归更合适的情况进行直观描述?

例如,以随机分配的农业推广计划和农民种植的几种不同作物的产量为例。您可以为每种作物运行几个不同的模型。或者你可以以某种方式聚合农作物。或者,也许您可​​以运行一个多元响应模型,其中您的因变量实际上是一个矩阵而不是一个向量。

我一直在阅读这一切的数学知识,但我没有找到一个很好的直观描述这些模型最有用的情况,也没有找到它们的实际陷阱。我知道错误将在响应之间关联。这是否意味着在个别回归能力不足的情况下你会获得更多的权力?如果随机分配变量,这些模型中估计的系数矩阵是否有因果解释?

2个回答

我认为我的评论已经足够长的时间来回答......

您可能想要查看多变量案例而不是单变量案例的一个原因是变量之间存在很多依赖关系。每个单变量响应很可能显示“没有影响”,但多变量响应显示很强。请参阅此图,了解仅在两个维度上的两组之间的差异

注意这里,yx都是 DV,分组变量(红色/黑色指示符)是“回归”中的(唯一)IV。

两组,两个依赖 DV

问题是两组之间的平均值真正不同的东西不是变量X 变量Y(那是,μX2μX1几乎为零,对于Y),而是一个特定的线性组合——在这个例子中,YX- 两组的手段差异很大。

在那种情况下,单变量t测试只发现多元测试很容易看到它(这可以通过回归和多元回归来完成,其中只有一个 IV,即组指标)。

同样的问题也适用于其他不太简单的回归。

您的问题似乎与“多重”回归(具有单一结果和多个连续预测变量的回归)有关,而不是“多变量”(多个结果,单一预测变量)