我是机器学习的新手,从事对象检测,但对图像中对象的位置不感兴趣,所以我只想知道是否可以训练这样的神经网络,如果可以,如何训练?(我只想要图像中存在的对象列表)。我不确定构建这样一个网络需要什么样的数据集。
编辑:我会更清楚我的问题。首先,我了解 CNN 和 VGG16、Inception、Resnet 等模型。我怀疑这些网络是否可以被训练来识别对象,即它将预测图像中存在哪个对象并给出概率。如果我想训练一个网络来判断图像中是否存在特定对象怎么办,即如果存在任何对象,则输出应该为是,否则为否
我是机器学习的新手,从事对象检测,但对图像中对象的位置不感兴趣,所以我只想知道是否可以训练这样的神经网络,如果可以,如何训练?(我只想要图像中存在的对象列表)。我不确定构建这样一个网络需要什么样的数据集。
编辑:我会更清楚我的问题。首先,我了解 CNN 和 VGG16、Inception、Resnet 等模型。我怀疑这些网络是否可以被训练来识别对象,即它将预测图像中存在哪个对象并给出概率。如果我想训练一个网络来判断图像中是否存在特定对象怎么办,即如果存在任何对象,则输出应该为是,否则为否
加拿大高级研究所 (CIFAR) 开发了针对该问题的标准计算机视觉和深度学习数据集。CIFAR-10 数据集由 60,000 张照片组成,分为 10 个类别(因此命名为 CIFAR-10)。类包括常见的物体,如飞机、汽车、鸟类、猫等。数据集以标准方式拆分,其中 50,000 张图像用于训练模型,其余 10,000 张用于评估其性能。其他数据集有 MNIST、CIFAR-100 STL-10、SVHN、ILSVRC2012 等
最先进的结果是使用非常大的卷积神经网络实现的。您可以在Rodrigo Benenson 的网页上了解 CIFAR-10 的结果状态。模型性能以分类准确率报告,性能非常好,超过 90%。
这是一个关于使用 caffe 和 python 的卷积神经网络 的示例教程
是的。只需在最后一层之后移除 softmax 函数或将其替换为 Sigmoid,您的 vanilla 分类神经网络就会成为对象存在检测网络。这将问题从分类转变为多分类或回归,并且可以在图像中并行检测多个类别,而无需仅预测一个或固定数量的类别。
是的,你可以训练,但在此之前,你必须训练网络来识别你想要的对象。这意味着首先您需要将数据集与样本一起输入到网络中。让我们举个例子。如果您想从图像中识别椅子对象,请制作具有不同设计的椅子数据集。因此,基于此,如果您将任何新的椅子图像作为输入进行检查,它将将该对象识别为训练数据集中的椅子。