图像分类是分配其中之一的任务给定图像的先前已知标签。例如,您知道您将获得几张照片,并且每张图片都恰好有一张在里面。算法应该说明照片显示的内容。
图像分类的基准数据集是ImageNet;尤其是大规模视觉识别挑战赛 (LSVRC)。它正好有 1000 个类和大量的训练数据(我认为有一个大约 250px x 250px 图像的下采样版本,但许多图像似乎来自 Flicker)。
这一挑战通常通过 CNN(或其他神经网络)来解决。
是否有任何论文尝试在 LSVRC 中不使用神经网络的方法?
澄清问题:当然,还有其他分类算法,如 最近的邻居或 SVM。但是,我怀疑它们是否适用于那么多类/那么多数据。至少对于-NNs 我敢肯定预测会非常慢;对于支持向量机,我猜拟合和预测都会很慢(?)。