我正在寻找一种解决方案来检测图像表达的不同情绪/风格。不幸的是,这个任务没有多标签数据集。
基于单个标记数据定义多标签分类模型的场景对我来说似乎并不太荒谬,但我仍然找不到任何出版物或其他资源来解决这个问题。
因此,我非常感谢任何提示如何解决这样的场景(例如,以弱监督的方式从可用的单标签数据集导出多标签数据集)。
我正在寻找一种解决方案来检测图像表达的不同情绪/风格。不幸的是,这个任务没有多标签数据集。
基于单个标记数据定义多标签分类模型的场景对我来说似乎并不太荒谬,但我仍然找不到任何出版物或其他资源来解决这个问题。
因此,我非常感谢任何提示如何解决这样的场景(例如,以弱监督的方式从可用的单标签数据集导出多标签数据集)。
我会使用适合多标签的损失(sigmoid 激活/二元交叉熵损失而不是 softmax 激活/分类交叉熵损失)来训练它。该模型将为您提供每个标签的概率,因此您可以决定如何在应用程序中解释它们。
话虽如此,一些多标签问题大多是单标签,双标签少得多,除此之外几乎没有标签。对于这样的问题,您可以尝试单标签模型,看看它是否比多标签模型效果更好。或者有一个合奏:)
两种可能的方法:
通过使用情绪/风格标签标记每个图像,将其视为监督学习问题。
通过应用主题建模将其视为无监督学习问题。每个图像都可能属于一个主题。然后用情绪/风格标记每个主题。
如果您走@andris 建议的路线(您可能拥有的唯一选择),则多标签类仍然是任意的,您选择的概率切点。这似乎不会增加真正的价值