我正在寻找一种软件解决方案来从各种格式(PDF、Microsoft Word 等)的简历/简历中提取数据。
我需要的是:
- 将姓名、姓氏、电子邮件、电话号码、分段邮政地址(街道、邮政编码等)提取到可利用的结构化输出中
- 免费软件解决方案
- 提取其他典型的简历条目(以前的职位等)
- 一种将之前的结果直接集成到OpenERP中的解决方案(请注意,OpenERP 现在称为odoo)。
理想情况下,它将与OpenERP无缝集成,但任何提供键/值输出的解决方案都足够了,因为我可以自己开发集成胶水。它应该让我在 Linux 服务器上获得结果,因此与 Linux 兼容的软件会更好,但即使是具有合理响应时间的交互式使用的 Web 服务也可能没问题。
根据我自己的研究,开放申请者可能是一个很好的候选者,因为它提供了“简历解析”并且是免费软件。但不幸的是,它似乎从网络上消失了。
可以完成这项工作的非自由软件包括DaXtra Parser、ResumeGrabber、Rchilli Resume Parser、Automated Hr Software Resume Parser。