如何按图像对文档进行分类?

数据挖掘 Python 类似文件
2022-02-18 20:55:08

我需要一个开源解决方案来对文档进行分类。我不想使用 NLP,我只需要检查外观。

我试过OpenCV我有一个模板,我需要匹配它。

import cv2

template = cv2.imread(template_file,0)
template = cv2.normalize(template, None, alpha=0, beta=1, norm_type=cv2.NORM_MINMAX, dtype=cv2.CV_32F)

 method = ['cv2.TM_CCOEFF_NORMED'] 

 img = img2.copy()
 method = eval(meth)
 # Apply template Matching
 res = cv2.matchTemplate(img,template,method)

 min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
 if (max_val > threshold):
    print('match OK')

这种方法似乎不那么健壮,我得到了很多误报。

1个回答

您可能希望根据数据集的大小查看 Siamese CNN。一个很好的介绍可以在这里找到。