如何有效地验证基于正则表达式的简历解析器

数据挖掘 机器学习 Python nlp 数据科学模型 正则表达式
2022-03-01 18:02:37

我正在使用基于规则的逻辑从简历中提取特征。基本上,我试图找出候选人是否在不到 1 年的时间内换了公司。所以我有代码可以使用python找到它。但是,如果我想验证它,我目前正在手动完成一些简历,这意味着我打开简历并查看候选人是否在不到 1 年的时间内更换了公司,并将其与我的正则表达式逻辑给出的结果进行比较。但这是一个耗时的验证过程。

有没有更好的方法来验证这段 python 代码。?

1个回答

有没有更好的方法来验证这段 python 代码。?

不,因为任何自动方法都相当于创建另一个学习器,并且无法知道它在工作中的好坏。因此,除非您找到另一个带注释的数据集(即一组带有标签的简历,表明他们在过去一年中是否换过工作),否则您必须创建自己的带注释集。