Python 上的模块,可用于在语料库的文本段落中缺少单词/字母预测

数据挖掘 数据挖掘 Python 文本挖掘 预测建模
2022-03-01 08:44:01

有人可以向我推荐一些 Python 包,我可以用它们来预测一段文本中的缺失词。缺失的单词是现有语义单词列表的一部分。(缺失单词列表是一组常见的单词,例如 was、were 等)。如果 R 中有更好的包可以帮助我解决这个问题,那么如果你在这里发布它会非常有用。

谢谢你。

1个回答

这个问题似乎与Kaggle的十亿词插补挑战中的问题完全相同(或至少非常相似)。论坛中讨论的一些方法可能会对您有所帮助。我对有用工具/方法的最初想法是 word2vec、stanford NLP 工具和 sklearn。