当我们想使用像 SVM 这样的分类器时,我们首先应该使用像 SIFT 这样的算法来提取描述符。
但我有一个可能会被称为愚蠢的问题:让我们假设
其中 M 是描述符的总数,并且表示第 m 个描述符的描述向量。我的问题是:什么句子“表示第 m 个描述符的描述向量”是什么意思?这是否意味着我们在图像中有 1000 个兴趣点,每个兴趣点都有,比如说,一个 128 维的 SIFT 描述符?我们有 128000 个值吗?
当我们想使用像 SVM 这样的分类器时,我们首先应该使用像 SIFT 这样的算法来提取描述符。
但我有一个可能会被称为愚蠢的问题:让我们假设
我认为你有一个矩阵。
每个 Row / Column 是图像中一个点的描述符向量。
就像有特征一样,比如说M个特征,每个点都有M个值对应M个特征。
所以描述符向量中的每个元素都是该点的特定特征的值。
是的,如果您有 M = 128 个特征和 1000 个点,您将得到一个包含 128,000 个条目的矩阵。