工作推荐引擎

数据挖掘 机器学习 特征选择 推荐系统
2022-02-20 09:15:44

我的女朋友最近一直在努力寻找新工作,所以我想我会做一个网站来帮助她。基本的想法是,她会看到一份工作列表,评估她的兴趣,然后每天都会通过电子邮件向她发送一份希望有趣的工作。到目前为止,我已经解决了前端,但我正在努力解决引擎问题。我研究了不同类型的推荐引擎,似乎基于内容的引擎是可行的方法,因为她可能是唯一的用户。话虽如此,特征选择是有问题的,因为工作分类有点不切实际。例如,我可以有像“管理”或“分析”这样的工作类别,但这些很难定义,特别是如果我正在分析某些关键字的工作描述。

对不起,文字墙。我的基本问题是我应该如何为这个工作推荐引擎选择功能?

谢谢您的帮助。

2个回答

对于这个问题的第一次通过,我建议只使用一个简单的文档搜索/分类器功能集,例如bag of words,或者可能tf-idf针对每个完整的职位描述,看看你可以从基本分类器中得到什么结果。

您可以根据女友入围或拒绝每个项目来训练模型。这些特征也可以或多或少地直接用于按相似程度查找和排序其他文档。

一袋词模型不是很复杂。然而,它实现起来很简单,并且有合理的机会用有限的数据量进行训练。有了这个项目,您对优化人类的搜索时间比获得最佳准确性更感兴趣。任何比随机机会更好的准确性都应该是有帮助的。

制作推荐引擎的基本方法是:

  • 将个人资料链接到相似的个人资料
  • 提取个人资料的特征,并将它们与此处的工作特征相匹配
  • 上述两种解决方案的混合

无论哪种方式,您都需要数据、标签、特征提取器……