这些是人类手动标记的特征吗?或者是否有任何技术可以获得这些功能。这与学习的特征有关吗?
计算机视觉问题中手工制作的特征是什么意思?
“手工制作”特征是指使用图像本身中存在的信息使用各种算法得出的属性。例如,可以从图像中提取的两个简单特征是边和角。基本的边缘检测算法通过查找图像强度“突然”变化的区域来工作。要理解这一点,我们需要记住,典型的图像只不过是一个 2D 矩阵(或多个矩阵或张量或 n 维数组,当您有多个通道,如红色、绿色、蓝色等时)。在 8 位灰度图像(或“黑白”图像,尽管后一种定义不太准确)的情况下,图像通常是一个 2D 矩阵,其值范围从 0 到 255,其中 0 表示完全黑色和 255 是完全白色的。现在想象一个黑板贴在全白墙上的图像。当我们在图像中从左到右移动时,矩阵的其中一行中的值可能看起来像 255-255-255... 因为我们将沿着墙壁“移动”。然而,当我们即将击中图像中的黑板时,它可能看起来像 255-255-0-0-0...正如您可能已经猜到的,黑板“开始”在图像中从零开始的位置。换句话说,图像沿“x”轴的“强度”下降得相当突然(或沿 x 的负梯度非常大),这意味着典型的边缘检测器会认为它是一个很好的边缘候选者。沿着墙壁。然而,当我们即将击中图像中的黑板时,它可能看起来像 255-255-0-0-0...正如您可能已经猜到的,黑板“开始”在图像中从零开始的位置。换句话说,图像沿“x”轴的“强度”下降得相当突然(或沿 x 的负梯度非常大),这意味着典型的边缘检测器会认为它是一个很好的边缘候选者。沿着墙壁。然而,当我们即将击中图像中的黑板时,它可能看起来像 255-255-0-0-0...正如您可能已经猜到的,黑板“开始”在图像中从零开始的位置。换句话说,图像沿“x”轴的“强度”下降得相当突然(或沿 x 的负梯度非常大),这意味着典型的边缘检测器会认为它是一个很好的边缘候选者。
我们刚才看到的算法只是非常基础的算法,其他的像 Harris 角点和 Hogg 检测器使用稍微“复杂”的算法。实际上,即使是 Canny 边缘检测器也比我刚才描述的要多得多,但这不是重点。关键是,一旦您了解图像只不过是一个数据矩阵或 n 维数组,其他算法也并不难理解。
关于你的最后一个问题:
这与学习的特征有关吗?
例如,“手工制作的特征”通常与用于对象识别和计算机视觉的“传统”机器学习方法一起使用,例如支持向量机。然而,像卷积神经网络这样的“较新”方法通常不必提供这种手工制作的特征,因为它们能够从图像数据中“学习”特征。或者套用 Geoff Hinton 的话说,这种特征提取技术是“在该领域变得愚蠢之前在图像识别中很常见的技术”。