回归。为什么 a 和 b 比 a+b 解释得更多?

机器算法验证 回归 r平方
2022-03-19 05:22:00

所以我有 1987 年的观察样本。我正在检查会计措施如何解释股票收益。如果我对 CFO(现金流)和应计收益的股票收益进行回归,我会得到R2=0.075. 但是,如果我对收益(CFO+应计)的股票回报率进行回归,我只会得到R2=0.042. 我想知道这怎么可能。

1个回答

原因是灵活性。

选项 1:当你倒退时X1,X2Y您允许系数不同。换句话说,你的回归方程是Y=α+β1X1+β2X2+ϵ. 注意β1可能等于β2如果它愿意——如果这就是数据所暗示的。

选项 2:当你倒退时X3=X1+X2Y您正在强制系数相同 - 即使数据不希望它们相同。您的回归方程变为Y=α+β1(X3)+ϵ=α+β1X1+β1X2+ϵ.

回归方程将始终选择最小化 SSE 的系数值(从而最大化R2) 基于您提供的数据。在选项 2 中,它会尽力而为,但这永远不会更好(就R2) 然后是选项 1。这是因为选项 2 中系数向量的每个可能值都是选项 1 中系数向量的可能值的子集。