如何使用深度学习执行多项式地标检测

数据挖掘 深度学习 rnn 卷积神经网络
2022-03-07 23:59:31

我正在尝试构建一个使用深度卷积神经网络来分割车辆的系统。我熟悉预测一定数量的点(即结束具有 4 个神经元的密集层的神经架构,以预测两者的 2 个点(x,y)坐标)。然而,车辆有许多不同的形状和大小,并且一辆车可能需要比另一辆车更多的分割点。如何创建可以具有不同数量输出值的神经网络?我想我可以使用某种 RNN,但需要一些指导。谢谢

例如,在下图中,两辆车具有不同数量的标记关键点。

在此处输入图像描述

1个回答

当您对每张图像都有固定数量时,地标很好,但我认为这不是解决您问题的正确方法。相反,我认为您应该研究通过应用蒙版来分割图像的模型。一个开始的地方可能是研究 Mask R-CNN。

这是论文:Mask R-CNN

以下是如何使用 Keras 使用您自己的数据集训练现成的 Mask R-CNN 实现:教程