一个免费的软件简历/简历解析器

软件推荐 免费 linux 开源的 pdf
2021-10-24 23:22:07

我正在寻找一种软件解决方案来从各种格式(PDF、Microsoft Word 等)的简历/简历中提取数据。

我需要的是:

  1. 将姓名、姓氏、电子邮件、电话号码、分段邮政地址(街道、邮政编码等)提取到可利用的结构化输出中
  2. 免费软件解决方案
  3. 提取其他典型的简历条目(以前的职位等)
  4. 一种将之前的结果直接集成到OpenERP中的解决方案(请注意,OpenERP 现在称为odoo)。

理想情况下,它将与OpenERP无缝集成,但任何提供键/值输出的解决方案都足够了,因为我可以自己开发集成胶水。它应该让我在 Linux 服务器上获得结果,因此与 Linux 兼容的软件会更好,但即使是具有合理响应时间的交互式使用的 Web 服务也可能没问题。

根据我自己的研究,开放申请者可能是一个很好的候选者,因为它提供了“简历解析”并且是免费软件。但不幸的是,它似乎从网络上消失了。

可以完成这项工作的非自由软件包括DaXtra Parser、ResumeGrabber、Rchilli Resume Parser、Automated Hr Software Resume Parser。

4个回答

鉴于您的问题的语气暗示了一些编程经验,我建议这可以通过以下方式在python中实现:

  1. 将每个 CV 转换为通用格式,例如 markdown 或纯文本:
  2. 要么:使用re / regex 使用一组 python 正则表达式选择相关数据,这可能会给你最快的结果,但可能不是最全面的 ,或者
  3. 使用 nltk 解析和分析 - 这可能是更强大的解决方案,但需要花费大量时间和精力来实施。

    • 将姓名、姓氏、电子邮件、电话号码、分段邮政地址(街道、邮政编码等)提取到可利用的结构化输出中 -的,一组好的正则表达式就足够了。
    • 免费 - 的,除了开发成本
    • 提取其他典型的简历条目 -取决于您付出的努力,并且可能需要 nltk 解决方案
    • 与 OpenERP 集成 - 因为您可以以您需要的任何格式输出,我会说是的,或者您可以使用OpenERP 客户端
    • 在 Linux 服务器上运行 -绝对是。

我又遇到了一家简历解析公司www.candidatezap.com ,他们声称无需编码/编程也无需集成即可将简历上传到许多 ATS / CRM。

这是您可以使用的免费简历/简历解析 api 服务,与您的应用程序或网站集成非常简单。在网站上有一些示例 .net 代码集成

如果您正在寻找免费的简历解析器,请查看https://affinda.com/resume-parser/

输出采用 XLS、JSON 和 XML 格式。该解决方案是使用自然语言处理的最新进展构建的,以确保它可以处理最广泛的简历格式集。

您需要自己开发所描述的集成,并且考虑到输出可以在 JSON 文件中,它应该很简单。

字段包括姓名、地点、电话、电子邮件、网站、工作经验(工作、雇主、地点、日期)、教育(机构、学位、地点、日期)、技能等。

希望这会有所帮助!