什么是图像处理中的“描述向量”?

信息处理 图像处理 图像分割 机器学习
2021-12-30 02:52:52

当我们想使用像 SVM 这样的分类器时,我们首先应该使用像 SIFT 这样的算法来提取描述符。

但我有一个可能会被称为愚蠢的问题:让我们假设

Da={da,1,da,2,da,3,...,da,M}
其中 M 是描述符的总数,并且da,?表示第 m 个描述符的描述向量。我的问题是:什么句子“da,?表示第 m 个描述符的描述向量”是什么意思?这是否意味着我们在图像中有 1000 个兴趣点,每个兴趣点都有,比如说,一个 128 维的 SIFT 描述符?我们有 128000 个值吗?

1个回答

我认为你有一个矩阵。
每个 Row / Column 是图像中一个点的描述符向量。

就像有特征一样,比如说M个特征,每个点都有M个值对应M个特征。

所以描述符向量中的每个元素都是该点的特定特征的值。

是的,如果您有 M = 128 个特征和 1000 个点,您将得到一个包含 128,000 个条目的矩阵。