我正在使用 U-Net 从事医学领域的语义分割任务。假设我在医学图像上训练了一个 U-Net 模型,目标是从医学图像中分割出韧带。我假设,如果我在仅包含单个标记韧带的图像上训练该模型,它将能够很好地分割出单个韧带。如果我用多条韧带的图像呈现它,它是否也能很好地分割多条韧带?
根据我的理解,语义分割只是逐像素分类。结果,图像中的对象数量不应该不相关,因为它只查看单个像素吗?那么,只要一个像素与韧带的像素匹配,它就应该能够平等地分割它,对吧?
还是我误解了一些东西?
基本上,如果我在仅具有单个韧带的图像上训练 U-Net,它是否也能够根据我上面的逻辑同样地分割具有多个韧带的图像?