在特征工程期间,我们可以通过使用算术运算从现有特征中创建新特征,尽管是否是线性的。
假设我们有两个特征x和z。然后,我们可以通过求和x和z来创建(设计)一个新特征f,假设这在用例的上下文中是有意义的,因此变成f = x + z。
或者,如果要创建非线性特征,则可以实现类似以下内容,f = x*x + z。
我的问题是,鉴于我们有x和z并且知道它们与目标变量的相关强度,那么创建第三个特征(它只是原始两个特征的组合)的意义何在?
第三个特征能指出前两个特征不能指出的什么?
也许如果组合是非线性的,我可以理解,但如果组合是线性的呢?为什么应该有帮助?
PS 我偶然发现了一篇关于 Cross-Validated 解决这个问题的帖子,但鉴于答案的性质,它仍然让我感到疑惑和不满意。