我正在尝试从他/她的简历中提取员工的技能组合。我将简历以纯文本形式存储在数据库中。在这种情况下,我没有预定义的技能。我应该如何解决这个问题?
我可以想到两种方法:
使用无监督方法,因为我没有预定义的技能。我将使用主题建模从简历中提取技能,但如果我没记错的话,主题建模使用BOW方法,在这种情况下可能没有用,因为这些技能几乎不会出现一两次。(如果您能就主题建模向我提供更多启发,我将不胜感激)。
另一种方法是手动标记简历的技能并使其成为监督学习问题。但是我有大约 500 份简历,手动标记会非常繁琐且非常耗时。
欢迎任何建议。
谢谢。