我目前正在学习 CNN。我对如何初始化过滤器(又名内核)感到困惑。
假设我们有一个核心。这个过滤器的值是如何在训练前初始化的?你只使用预定义的图像内核吗?或者它们是随机初始化的,然后随着反向传播而改变?
我目前正在学习 CNN。我对如何初始化过滤器(又名内核)感到困惑。
假设我们有一个核心。这个过滤器的值是如何在训练前初始化的?你只使用预定义的图像内核吗?或者它们是随机初始化的,然后随着反向传播而改变?
内核通常以看似任意的值初始化,然后您将使用梯度下降优化器来优化这些值,以便内核解决您的问题。
有许多不同的初始化策略。
当我的模型无法收敛(梯度问题)或在损失函数开始减小之前训练似乎卡了很长时间时,我会探索初始化策略。这些迹象表明可能需要寻找更好的初始化策略。