我在数据规范化方面遇到问题。我有需要为其创建 SVM 的数据。我将使用该模型进行实时预测。我知道测试元组应该使用与训练数据完全相同的值进行归一化。但是,我的测试元组的值可能超过训练集中数据的最大值。例如,在训练集中,我有给定特征的以下值。
Maximum : 20457
Minimum: 3
在测试元组中,我有时会得到像 35002 这样的值。这存在于大多数功能中。
如果我知道所有特征的最大值和最小值,问题就会得到解决,但这是不可能的。最大值可以达到任何值。在这种情况下如何进行数据规范化?有人可以帮我吗?