我正在做一个关于在不断变化的环境中进行视觉位置识别的项目。这里使用的 CNN 主要是 AlexNet,从第 3 层构造一个特征向量。
有谁知道使用其他 CNN 的类似工作,例如 VGGnet(我正在尝试使用)和相应的层?
我一直在尝试 VGGnet-16 的不同层。我试图通过使用查询图像和数据库图像之间的余弦差来获得与查询图像最近的对应关系。至今没有好的结果。
我正在做一个关于在不断变化的环境中进行视觉位置识别的项目。这里使用的 CNN 主要是 AlexNet,从第 3 层构造一个特征向量。
有谁知道使用其他 CNN 的类似工作,例如 VGGnet(我正在尝试使用)和相应的层?
我一直在尝试 VGGnet-16 的不同层。我试图通过使用查询图像和数据库图像之间的余弦差来获得与查询图像最近的对应关系。至今没有好的结果。
神经网络在其每一层上构建越来越复杂的数据表示,因此您可以自由选择任何用于此目的的神经网络架构。由于神经网络的较低层(靠近输入层的层)主要计算图像的低级别表示(如 gabor 滤波器等),因此大多数架构在此级别上不会有太大差异。因此,如果您想从第 3 层本身进行适当的微调,则可以使用 VGGnet。