我想在非常详细(0.075m/pix)的 USGS 高分辨率正射影像中检测街道和人行道表面,这基本上意味着具有两个类别的图像分割。有问题的地方是类似于这个的住宅区。我将从 USGS 下载 GeoTIFF 中未压缩的原始图像进行检测。
我读到神经网络在图像分割中表现得非常好,我想尝试一下。我白天是一名开发人员,所以我可以编码,但我是神经网络的初学者,只知道关于架构、加权和反向传播等的基本原理。是否可以直接进入我的任务,或者我需要从更简单的事情开始?如果可以节省时间,我宁愿直接加入。
我浏览了几篇处理类似事情的论文,它们看起来很复杂。有一些简单的方法可以让我开始吗?我的意思是神经网络中的一个开源项目,它处理类似于我的任务的图像分割,我可以利用它吗?
我看到需要先训练神经网络,我准备先进行手动分割以获得训练数据。但是,我不知道神经网络设计/架构,如何设计层,我需要多少层等。我还想利用网络将学习一些关于如何建造街道和人行道的基础知识 -它们是(不确定我的术语是否正确)“线性结构”,通常长几米,甚至可能不会在图像中结束,而且人行道通常沿着街道延伸,街道有十字路口等。