丢弃神经网络中输入之间的相关性

数据挖掘 神经网络 相关性 降维
2022-01-28 15:01:46

我正在解决 4 个输入和 1 个连续输出变量的问题。4 个输入变量的所有值之和始终为 1。

a1+a2+a3+a4=1

所以,它们是相关的。

我的问题是:我应该使用所有 4 个变量进行神经网络训练吗?或者,我应该使用其中任何 3 个来消除相关性吗?如果我使用全部 4 有什么问题吗?

1个回答

如果您想选择 3,您可以尝试一些特征选择技术。

也就是说,您是否测试过数据的多重共线性?也许你有,但我认为这并不a1+a2+a3+a4=1意味着高度相关。

不过,要回答您的问题,尝试使用四个变量训练神经网络确实没有什么坏处。如果其中一个输入是不必要的,NN 训练很可能会将权重设置为接近于零,而无需您选择一个。