为什么在 FR(人脸识别)中不首选一般/原始 softmax 损失?

数据挖掘 深度学习 美国有线电视新闻网 图像识别 物体识别
2021-10-13 18:42:58

在一些论文中,我读到 softmax 损失在 FR 中不是首选,因为它没有提供良好的类间和类内边距,但无法理解“为什么?”。所以有人可以解释一下,为什么在数学和理论上都不喜欢在 FR 中使用 softmax 损失。

1个回答

softmax loss 的缺点写在您的参考论文中。

“ArcFace”(arxiv.org/pdf/1801.07698.pdf)和“通过集中坐标学习进行人脸识别” https://arxiv.org/pdf/1801.05678.pdf

(1) 线性变换矩阵 W ∈ Rd×n 的大小随着身份数 n 线性增加;

  • 训练数据中有数百万个身份。复杂性会增长太多。

(2) 学习到的特征对于闭集分类问题是可分离的,但对于开集人脸识别问题的判别力不够。

  • 在开集问题中,未知类可能出现在测试阶段。在闭集问题中,所有测试类在训练阶段都是已知的。人脸识别是开集问题。