使用 NLP 和 ML 从图像中提取数据

数据挖掘 机器学习 Python nlp 数据清理
2022-02-26 03:29:40

在此处输入图像描述嗨,我正在尝试使用 GoogleVision / Textract 使用某些条件从保险卡或许可证卡等图像中提取姓名、planType、电话号码等数据,但它没有提取正确的内容。

有没有办法结合使用 ML 和 NLP 来解决这个问题

谢谢

1个回答

您需要执行OCR(光学字符识别)但是,如果您的图像质量非常差,或者它们歪斜和扭曲,这可能会导致不良结果)。您可以使用的一种工具是来自 Google的tesseract tesseract 。您可以训练它以识别图像中的文本。