我正在做一个项目,我必须从职位描述中提取技能。
我尝试通过清理数据(不删除停用词)、应用 POS 标签、将句子标记为技能/not_skill、使用 LSTM 网络训练数据。但是在预测时它会预测一个句子是否有技能/不技能。
一瞥数据如何
description skill/not_skill
Datacience and machine_learning skill
not information extracted not_skill
learn skill Python skill
我已经阅读了文章和研究论文,但我不确定在此之后如何进行。如何提取技能。
我遵循的这种方法来自这篇研究论文(using Supervised approach)。https://confusedcoders.com/wp-content/uploads/2019/09/Job-Skills-extraction-with-LSTM-and-Word-Embeddings-Nikita-Sharma.pdf