信息处理 - 什么是图像处理中的“描述向量”？ - 吾爱随笔录

当我们想使用像 SVM 这样的分类器时，我们首先应该使用像 SIFT 这样的算法来提取描述符。

但我有一个可能会被称为愚蠢的问题：让我们假设

D_{a} = {d_{a, 1}, d_{a, 2}, d_{a, 3}, . . ., d_{a, M}}

$\begin {equation} D_a=\{d_{a,1},d_{a,2},d_{a,3},...,d_{a,M}\} \end {equation}$ 其中 M 是描述符的总数，并且

d_{a, ?}

$d_{a,?}$ 表示第 m 个描述符的描述向量。我的问题是：什么句子“

d_{a, ?}

$d_{a,?}$ 表示第 m 个描述符的描述向量”是什么意思？这是否意味着我们在图像中有 1000 个兴趣点，每个兴趣点都有，比如说，一个 128 维的 SIFT 描述符？我们有 128000 个值吗？