我正在尝试决定是否应该扩展我的功能和响应以进行培训,并且我处于无法同时尝试扩展和不扩展的情况。
我的特征目前有一个大约 0.05 的标准,并且我正在研究的时间序列的行为非常依赖于规模(就市场上发生的情况而言,0.5 意味着与 0.05 非常不同的东西)。
如果我将功能扩展为 std 为 1,我能否期望在优化器方面的性能有重大改进?
我的模型是 MLP 和 1d conv 的不同组合,我的算法是使用 Adam 优化器的梯度下降。
谢谢![是的; 我是另一个试图预测股市的人]
路易斯说得对,我应该两者都试。但是我会留下这个问题,以防万一有人出现并给出一个精确归一化的数学证明是有用的/无用的。