我正在观看 Andrew Ng 关于参数与超参数之间区别的讲座,https://www.youtube.com/watch?v= VTE2KlfoO3Q&ab_channel=Deeplearning.ai ,我想到了一个问题。
超参数与参数之间真的有那么大的区别吗?
例如,权重通常被视为参数而不是超参数。但是最近的论文发现,随机搜索权重可以获得很好的结果,并且击败了state-of-the-art的优化方法https://arxiv.org/abs/1803.07055这不就是超参数调优的方法吗?
同时,也有论文调整学习率、优化器和其他与模型相关的所谓“超参数”。https://arxiv.org/abs/1606.04474
然后是通过基于梯度的方法直接学习超参数的方法。https://arxiv.org/abs/1903.03088
另一个灵感是自适应控制(巨大的领域,跨越 5 年),与控制器相关的所谓“超参数”总是被学习。