假设以下场景:
- 我有四个特征:、、和
- 特征之间存在不可忽略的多重共线性。
- 我想用这 4 个特征预测(响应变量)。
- 我使用简单的多元线性回归模型:
假设我想了解椅子的不同组件对椅子零售价的影响。例如:
= 椅子的零售价
= 使用的坐垫颜色
= 椅子的整体设计
= 椅子的强度
= 椅子的柔软度
是完全独立的,但由于多重共线性,其他特征都会受到其他特征的影响。例如,改变坐垫的颜色会改变椅子的设计。改变椅子的设计(结构)会改变椅子的强度。
我听说在严重的多重共线性下回归系数的分析是不可靠的。
假设多元回归模型很好地拟合了椅子价格,我可以天真地使用每个特征的回归系数来理解每个特征对响应变量的影响吗?如果不是,我应该使用什么技术?
例 1:如果我使用红色坐垫 ( ),我可以将零售价提高 3 美元
例 2:如果我使用会议室风格的椅子 ( ),我可以增加 12 美元的零售价