这是我第一次使用数据分析工具来找出问题的解决方案。我有一个包含以下列的表格Person ID, Person Name, Note ID, Note (notes is a free form text where a call representative can enter their comments) Insert User
。我已获得key phrases
要从该列中识别的Note
列表。这些关键短语采用句子格式。例子:
我必须从这些笔记中找到准确或相似的匹配短语。我的最终报告的格式看起来像这样
我查看了几篇与文本匹配相关的文章,其中建议了一些选项,例如
模糊,Doc2vec,Difflib,python-levenshtein
这一切都如此令人困惑。即使我有一个初学者来选择最合适的选项,我也可以从那里拿走它。有什么建议?太感谢了!