根据我在网上研究论文中找到的理解和文字:
基于像素的对象识别:训练神经网络以直接根据像素数据定位单个对象。
基于特征的对象识别:窗口的内容被映射到作为输入提供给神经分类器的特征空间。
上述 2 个定义在更简单的语言中意味着什么?特别是第2点。
另外,有人可以指出我可以更详细地解释上述方法的论文/资源/文章吗?
根据我在网上研究论文中找到的理解和文字:
基于像素的对象识别:训练神经网络以直接根据像素数据定位单个对象。
基于特征的对象识别:窗口的内容被映射到作为输入提供给神经分类器的特征空间。
上述 2 个定义在更简单的语言中意味着什么?特别是第2点。
另外,有人可以指出我可以更详细地解释上述方法的论文/资源/文章吗?
顾名思义,基于像素的对象识别通过分析图像的单个像素来工作。例如:您分析具有许多不同深浅的蓝色和一些灰色像素的图像 - 您可能会假设这是天空中的飞机或水中的船的图像。
您还可以通过计算 2 个图像的每个像素之间的差异并总结差异来寻找相似的图片。差异之和越小,图片越相似。
这取决于您的工作领域,但这些方法很可能不足以进行可靠的图像识别。
您还提到了神经网络。当然,您可以将原始像素数据输入神经网络,但这不是最先进的。你几乎总是会使用 CNN,这让我想到了你的下一点。
基于特征的对象识别,顾名思义,试图从图像中提取某些特征来执行分类。在将输出提供给神经网络之前,您可以使用多个卷积层进行分析。这种架构称为 CNN(卷积神经网络)。
如果不显示示例,很难解释这些功能的实际外观。我建议观看斯坦福课程 CS231n 的以下两堂课:
第一个解释了一般的图像分类,并展示了一些基于像素的算法的实现。第二个深入 CNN 并解释基于特征的方法。我强烈建议您观看完整系列,但如果您赶时间,那两堂课会告诉您您想知道的内容。