为滥用技术术语道歉。我正在研究一个通过卷积神经网络 (CNN) 进行语义分割的项目;试图实现编码器-解码器类型的架构,因此输出与输入的大小相同。
你如何设计标签?应该应用什么损失函数?尤其是在严重的类不平衡的情况下(但类之间的比例因图像而异)。
该问题涉及两类(感兴趣的对象和背景)。我正在使用带有 tensorflow 后端的 Keras。
到目前为止,我正在设计预期的输出,使其与输入图像的尺寸相同,并应用逐像素标记。模型的最后一层具有 softmax 激活(用于 2 个类)或 sigmoid 激活(表示像素属于对象类的概率)。我在为这样的任务设计合适的目标函数时遇到了麻烦,类型如下:
function(y_pred,y_true)
,
与Keras一致。
请尝试具体说明所涉及的张量的维度(模型的输入/输出)。任何想法和建议都非常感谢。