我在训练集中有 1500 多张黑白分类图像,我想创建一个概率模型来分类新图像。更明确地说,给定一个新的黑白图像,我的模型必须预测:
animal: 84%
vegetal: 12%
mineral: 4%
我看了这个讲座,我仍然对创建这个模型的过程有疑问。
1. 提取每张图像的关键点
如果我正确理解了视频,第一步是使用 SIFT 从所有图像中提取所有关键点,以创建一种视觉词词典。每个单词都由一个多维向量描述。
接下来,我必须使用- 表示创建视觉词组的方法。
问题 1:我应该创建多少个组?是否存在一个经验法则来确定我必须使用的号码?
2. 直方图的创建
现在,对于每个图像,我必须创建一个直方图/一个向量,其中每个特征对应于第 1 部分中定义的一组。与每个特征关联的值对应于图像中单词的频率。
问题 2:如何创建这个向量?事实上,每张图片都是独一无二的,永远不会与我字典中的单词完美匹配(顺便说一下,这些单词是不同单词的意思)。谁可以绕过这个问题?
3. 模型的创建
最后,我必须创建我的模型。在视频中,讲师使用了 SVM,并且必须按类别创建一个分类器(二元分类器)。就我而言,我有 100 个不同的类别(我的介绍是一种简化),我更喜欢只有一个分类器。另外,我想获得给定图像的概率成为类别的一部分。
问题 3:是否可以只创建一个提供概率数据的分类器?
最后,如果您知道对我的数据进行分类的更好方法,请不要犹豫,对我描述的过程提出建议或更正。