我知道在这里发表了类似的帖子,但我想问一些后续问题。我正在进行交叉验证搜索以查找一组超参数的值,并且需要对数据进行规范化。
如果我们按如下方式拆分数据:
- “训练”(暂时称这组“A”)和测试数据
- 将“培训”拆分为培训(暂时将此集称为“B”)和验证集
规范化数据集时应该使用哪些参数?
我的想法是否正确:
- 我们对数据集“B”进行归一化,然后提取其均值和标准差
- 然后,我们使用从集合“B”获得的那些参数对验证集进行归一化
- 一旦我们使用验证集通过交叉验证找到我的超参数,然后我们规范化集“A”并提取其参数
- 使用集合“A”中的参数来规范化测试集
这是正确的,还是我误解了什么?我知道这是基本的,但我似乎无法在任何地方找到一个直接的答案?