我想构建一个分类器,它获取航空图像并输出位图。位图应该在航拍图像有水的每个像素处为 1。对于这个过程,我想使用 ConvNet,但我不确定输出层。我确定了两种方法:
- 有一个恰好有 2 个节点的输出层,这些节点指定航拍图像的中心像素是否对应于水。
- 有一个输出层,每个像素都有一个节点。因此,对于 64x64 图像,我将有 4096 个节点。
哪种方法更受欢迎,为什么?
我不清楚的另一件事是如何从 ConvNet 的输出中获取只有零和一的实际位图。假设我们使用方法 2,那么对于每个像素,我们的 ConvNet 会给我们一个介于 0 和 1 之间的概率,即该像素对应于水。我如何确定这个概率足够高以将我的位图中的值设置为 1?我是否只定义一个阈值,比如 0.5,如果值超过该阈值,我将像素设置为 1,还是有更复杂的方法?