我将此视为正则化技术:强制系数为非负数。什么时候是个好主意?它背后的直觉和逻辑是什么?
为什么非负回归?
机器算法验证
回归
正则化
2022-03-21 06:53:00
1个回答
这在某种程度上是贝叶斯意义上的,为您的模型添加了先验知识。根据评论,并不是每个人都会称其为“正则化”。我会,因为它限制了参数不会在整个地方剧烈变化,只是以不同于(比如)L1 或 L2 正则化的方式。
这什么时候有意义?任何时候我们确定回归系数应该是正的,但由于涉及的不确定性,一个无约束的模型可能适合一个负的模型。例如:
- 正如seanv507 所写,如果我们想根据总成本和商品数量来估算商品价格,那么采用正价格是有意义的。
- 我做零售销售预测。我们通常将促销效应限制为正,将价格影响限制为负。
- 同样,您可能会产生自相残杀效应,这通常是非常嘈杂的,因此是任何类型正则化的主要候选者。如果可口可乐有促销活动,我们预计百事可乐的销量会下降,因此在包含可口可乐促销活动的百事可乐销量模型中,我们会将这些系数限制为负数(或至少为非正数) .
是的,通常你可以证明系数的相反符号是可能的。但是,这通常涉及相当曲折的逻辑,并且您经常会发现在绝大多数情况下,约束参数会产生更好的模型和预测,即使您总是会发现可以从不受约束的参数中获利的孤立案例。
其它你可能感兴趣的问题