我只是在考虑训练一个仅使用一个标签数据的神经网络。
例如:假设我有许多包含狗的图像。现在我想教网络狗的样子,没有不包含狗的图像。
更正式:我想检查一个标签的可用性,所以理论上,我需要 2 个数据集:Dog 和 NoDog
我现在向自己提出的问题是:我将如何定义 NoDog 类?我可以输入任何东西,一些随机噪音或任何不包含狗的未标记数据?但是我如何确保我正确地对“no-dog”空间进行采样?“无狗”形象有哪些特点?“禁狗”空间很大,不知怎的,很难形容。
我有不同的想法:
- 使用相同的狗图像,但剪掉狗并用噪音填充它
- 训练一个 gan 并使用鉴别器进行二元分类
- 使用大量未标记的数据
有谁知道如何系统地解决这个问题?谢谢