我最近解决了很多 kaggle 操场问题,但我不明白如何提出足够好的模型架构,它可以得到 0.9+ 的验证准确度并且不会过拟合。
是否有一些公式,或者是确定过滤器和神经元的一些命中和试验方法。而且我总是在隐藏层中使用 relu 激活(在某处阅读),何时在隐藏层中使用其他激活。
你能制定一些我应该遵循的指导方针吗?考虑到我主要处理图像分类问题。
我还有其他一些提示,您可以在答案中分享。
我最近解决了很多 kaggle 操场问题,但我不明白如何提出足够好的模型架构,它可以得到 0.9+ 的验证准确度并且不会过拟合。
是否有一些公式,或者是确定过滤器和神经元的一些命中和试验方法。而且我总是在隐藏层中使用 relu 激活(在某处阅读),何时在隐藏层中使用其他激活。
你能制定一些我应该遵循的指导方针吗?考虑到我主要处理图像分类问题。
我还有其他一些提示,您可以在答案中分享。
没有理论理解,这会带来问题并为您指定最佳网络架构。所以不,恐怕没有公式。确实存在的是达成良好解决方案的策略。
好的策略是从简单开始并尝试进行迭代改进。定义您尝试优化的单个 KPI(错误指标),构建您能想象到的最简单的模型,希望它能够工作一点点,然后尝试从那里改进。通过尝试了解为什么您的模型不能以最佳方式执行,您可以获得改进。您需要能够区分欠拟合和过拟合以进行正确的修改。研究您的模型在特定图像上所犯的错误,并尝试通过更改模型来解决这些错误。
我认为您可能会发现 Coursera 上的这门课程很有趣:构建机器学习项目。