有哪些方法可以快速评估给定 NN 架构的潜力?

人工智能 神经网络 卷积神经网络 超参数优化
2021-10-28 00:50:02

主要问题

是否有某种方法可以利用某些超参数如何影响性能的一般知识,以非常快速地获得某种对给定架构可能有多好的估计?

细化

我正在使用 CNN 解决手写字符识别问题。我想尝试一些不同的架构(大部分是随机的)来迭代可能有用的东西。问题是一次运行需要很长时间。

那么有什么方法可以快速验证给定架构是否有前途呢?让我详细说明我的尝试:

  • 试一次是的,但也许我选择了一些糟糕的超参数组合,实际上该架构将成为突破性的。
  • 做贝叶斯优化那还是很慢。从示例和试验中,我看到收敛需要相当长的时间。此外,我还没有尝试优化,我只是想检查是否有任何潜力。
0个回答
没有发现任何回复~