神经网络(或其他监督学习算法)的输入空间是什么?

数据挖掘 机器学习 神经网络 深度学习 分类数据 监督学习
2022-02-21 07:10:44

在训练神经网络(或任何其他监督学习算法)时,我们提供输入变量和相应的输出。输入变量可以是连续的或离散的(在许多情况下是二进制的)。

如果在使用二进制输入数据进行训练后,我们在评估时为同一输入提供一个连续值会发生什么?该算法是否在内部将所有变量视为连续变量?

例如,假设其中一个输入是在训练数据集中以 0/1 的形式编码的 Young/Old。如果我们在预测阶段提供一个值,比如 0.2,会发生什么?它/它对网络是否有意义?

1个回答

我猜这取决于算法,但线性模型以及神经网络将所有变量视为连续变量。如果您在预测阶段提供 0.2,该算法将不会爆炸或发生任何事情。但是,您的算法是根据数据训练的。该算法充其量只能做它从训练数据中学到的东西。出于这个原因,当你给一个样本提供一个在整个训练集中没有出现过的值,或者它不遵循训练集分布时,不要期望任何有意义的东西。