数据挖掘 - 特征缩放 - 吾爱随笔录

我正在努力解决与特征缩放相关的概念问题。

假设我正在构建一个分类器（例如，一个 NN），并假设我依赖于未来对模型的输入特征进行缩放。

在这种情况下，我将使用它的均值和它的标准对训练集进行归一化，我将使用测试均值和标准对测试集做同样的事情。

让我们也假设我成功构建了我的分类器，然后我开始尝试对新输入进行分类。然而，对于这样的新输入，均值和标准是未知的！在使用我的模型进行处理之前，如何适当地缩放它们？也许我可以使用训练+测试中的平均值和标准......

我真的不知道这里的正确做法是什么……有什么提示吗？

感谢您的帮助！