让我们考虑一个为某些任务构建了一个完全监督的神经网络,例如在各种场景中定位一个对象。正如您可以想象的那样,标记数据非常耗时:必须手动定位图像中的对象并在其周围绘制一个边界框 - 一次一个。
假设我们有一个用于完全监督定位的普通卷积神经网络 (CNN),因此如下所示:
2D input image
|
convolutional-layer 1
|
...
|
convolutional-layer N
|
---flattened output---
|
fully-connected classifier
|
output layer
我们如何调整这种架构来利用弱标记的数据呢?
无论我们是否有滑动窗口方法,例如 OverFeat 或用于实际定位对象的概率分布:我们总是需要完全标记的训练数据。这是一个问题,因为在完全监督的情况下标记数据确实非常耗时。因此,完全标记的数据集非常罕见。
与此相反,通常存在大量弱标记或未标记的数据。在我看来,由于其广泛的可用性,弱标记/未标记数据具有很大的潜力。问题在于利用这种潜力而无需手动标记每个样本。
也就是说,我的问题是:如何利用弱标记的数据集(即“对象”与“无对象”)或完全未标记的数据集来提高全监督架构的鲁棒性,比如提到的 CNN?
通常可以将监督方法与一些无监督方法混合吗?就像启用完全监督的架构以某种方式利用弱标记数据进行训练一样?