我试图了解用于处理点云的PointNet网络并努力理解 FC 和 MLP 之间的区别:
“FC 是在每个点上运行的全连接层。MLP 是每个点上的多层感知器。”
我了解如何使用全连接层进行分类,并且我之前认为,MLP 是同一件事,但似乎不同的学术论文彼此之间以及与一般在线课程的定义不同。在 PointNet 中,它们似乎被用来表示不同的东西?
我的理解是,直到网络中的最大池为止,所有层对于 N 个点中的每一个都是相互独立运行的,然后 nx1024 层的输出被最大池化。那为什么要描述一个共享的 MLP 呢?
具有输入 3 个坐标的 MLP 如何导致 MLP 的输出为 64?还是从 64 到 1024?
如果这个 MLP 实际上是从所有 N 个点获取输入,那么 1024 个点如何导致 64 个宽的 MLP 层?
全局和局部特征是什么意思?