有些图片包含大象,有些则没有。我知道哪些图片包含大象,但我不知道它在哪里,也不知道它长什么样。
如果包含大象,我如何制作一个神经网络来定位图片上的大象?没有超过一头大象的照片。
有些图片包含大象,有些则没有。我知道哪些图片包含大象,但我不知道它在哪里,也不知道它长什么样。
如果包含大象,我如何制作一个神经网络来定位图片上的大象?没有超过一头大象的照片。
因此,假设您不允许使用转移方法(例如采用已经存在的大象对象检测器),我的建议是训练一个 CNN 分类器(标签是二进制的——大象存在,大象不存在),然后使用建立在类似grad cam中的策略。请注意,确实存在 gradcam++,但因为您可以确保只有一个实例,所以它不是必需的,只是更复杂。
请注意,由于您只需要位置而不是像素特异性,因此您甚至不需要进行引导反向传播,而只需要与最后一个卷积映射的关系。
一个简单的描述是,它使用最后一个特征图的类损失梯度来查看哪些位置有助于进行分类,然后你可以从那里升级到这些神经元接触的感受野
希望这有帮助!