少数镜头学习和目标检测器

数据挖掘 深度学习 物体检测 一次性学习
2022-02-18 11:16:53

我有一个包含很多类(~10000+)的数据集,但类的例子很少(~15-)。我想对这些类进行分类,但有一些特殊性。我的示例从视频流中提供。目前,我使用检测器(如 YOLO)进行对象检测,然后应用连体/三元组网络来获取嵌入。最后,我使用具有一个邻居的 Kneighbor 分类器进行分类。

真正的特殊性是,我想检测我的检测器提供的图片何时在我的类的子列表中。例如,在第 1 天,我有一个包含 100 个类的列表,我的目标是知道对象(由检测器提供)是否在我的 100 个类中,以及属于哪一个。我不知道如何最好地利用这些信息。你有什么想法吗?

现在,我预先计算了所有嵌入,然后对于每个对象,我只需要进行前向传递和距离计算。也许我可以将所有其他嵌入重新组合为“其他类”并保留 101 个类(我的子列表的 100 个类和“其他类”),但我不知道它是否真的有效。

总结一下,你有没有一些技巧可以通过连体/三元组网络获得更高的分数?我在 imagenet 上使用带有预训练权重的 ResNet,但可能存在一些技术可以提高得分。

0个回答
没有发现任何回复~