假设我必须校正可以在该范围内旋转的场景图像. 对于我的特定应用程序,我已经知道 CNN 是有意义的。我会用它来检测方向,然后应用适当的校正。我只是想考虑如何构建问题和目标函数。这篇博文提到了分类交叉熵损失与多标签分类问题的使用,其中标签是. 对我来说这没有多大意义,因为如果目标是 45,那么 44 的惩罚与 87 一样严重。
回归感觉更明智,除了数字线在这里绕回自身的事实。但是,由于最大池与反向传播一起使用,我不明白为什么我不能使用修改后的 MSE.
另一个潜在的解决方案可能是采用分类方法,但对目标概率应用高斯平滑,以目标标签为中心。
有人愿意发表评论或建议吗?