我正在解决 4 个输入和 1 个连续输出变量的问题。4 个输入变量的所有值之和始终为 1。
a1+a2+a3+a4=1
所以,它们是相关的。
我的问题是:我应该使用所有 4 个变量进行神经网络训练吗?或者,我应该使用其中任何 3 个来消除相关性吗?如果我使用全部 4 有什么问题吗?
我正在解决 4 个输入和 1 个连续输出变量的问题。4 个输入变量的所有值之和始终为 1。
a1+a2+a3+a4=1
所以,它们是相关的。
我的问题是:我应该使用所有 4 个变量进行神经网络训练吗?或者,我应该使用其中任何 3 个来消除相关性吗?如果我使用全部 4 有什么问题吗?
如果您想选择 3,您可以尝试一些特征选择技术。
也就是说,您是否测试过数据的多重共线性?也许你有,但我认为这并不a1+a2+a3+a4=1
意味着高度相关。
不过,要回答您的问题,尝试使用四个变量训练神经网络确实没有什么坏处。如果其中一个输入是不必要的,NN 训练很可能会将权重设置为接近于零,而无需您选择一个。