使用离散余弦变换的特征对图像的纹理进行分类有多可行?谷歌搜索“纹理分类 dct”只能找到一篇关于这个主题的学术论文,使用神经网络。
对于我的应用程序,我有一个大的标记图像语料库,其中整个图像是一致的纹理(例如,毯子、树皮、草地等的特写镜头)。
受对上一个问题的回答的启发,我正在考虑以下方法:
- 将每个图像分成 NxN 像素块
- 取每个块的 DCT
- 将每个 DCT 展平为 1xM 数组并将其馈送到 K-Means 聚类算法,并获取每个 DCT 的聚类标签
- 通过从 #3 计算每个图像的每个标签来计算每个图像的聚类标签的直方图
- 通过输入一组 [(histogram,image label)] 来训练 SVM 分类器
这会有多好?我实现了一个类似的系统,使用通过 SIFT/SURF 算法提取的特征,但我只能获得大约 60% 的准确度。
我还可以通过哪些其他方式使用 DCT 对纹理进行分类?