人脸识别的三元组损失函数?

数据挖掘 机器学习 深度学习 图像识别 卷积神经网络
2021-09-24 04:45:17

在关于Convnets的Andrew-NG coursera 课程中,他谈到了用于一次性人脸识别的三元组损失函数。

视频中给出的公式是,

||f(A)f(P)||2+α||f(A)f(N)||2
D(A,P)+αD(A,N)
L(A,P,N)=max(||f(A)f(P)||2||f(A)f(N)||2+α,0)
这里,
f(A) Person A
f(P)Different Picture of Person A
F(N)Another Person

我不明白我们为什么要使用α在公式。我明白理想的损失函数是减少D(A,P)并增加D(A,N)但是如果我们添加αD(一个,)它会增加它,这不是我们需要的吗?

1个回答

α称为边距。

我们不仅要最小化D(一个,)并最大化D(一个,ñ),也就是我们想要的 D(一个,)-D(一个,ñ)要小。我们不仅希望它是非积极的,我们还希望它足够消极。

这不仅是我们想要的

D(一个,)-D(一个,ñ)0

我们想要

D(一个,)-D(一个,ñ)-α.