被称为“ U-Net ”的神经网络(Ronneberger、Fischer 和 Brox 2015)是 Kaggle 最近举办的超声神经分割竞赛中的一项突出技术,在该竞赛中,创建具有高度重叠的像素掩码的算法获得了高分手绘区域。
(克里斯托弗·赫夫勒的照片)
如果继续对每个像素进行分类(可能来自下采样图像),则必须有多种方法来结合相邻像素倾向于具有相同类别的先验知识,而且所有正分类必须位于单个空间区域。但是,我无法弄清楚这些 U-Net 是如何做到的。他们确实对每个像素进行了分类,尽管是通过卷积和池化运算符的迷宫:

涉及到分离边界,但论文指出它们是“使用形态学运算计算的”,我认为这意味着与 U-Net 本身完全分离。这些边界仅用于修改权重,以便更多地强调边界处的像素。它们似乎没有从根本上改变分类任务。
在对每个像素进行分类时,这种称为“U-Net”的深度卷积神经网络如何结合预测区域将是单个空间区域的先验知识?
