我正在研究一个自然语言处理数据问题,并从中选择了一些关键字作为特征。我想将它们归为一个标题。但我找不到任何方法或算法来做到这一点?我尝试使用 MALLET 进行主题建模。它将相似的词分组到一个集群中。我想要一个标题或主题附加到它们。
有没有办法在一个主题下将相似的单词分组并为其分配一个标题?
有许多不同的功能需要获得一个主题,例如应该属于相机的图像质量相机自拍分辨率。需要将这些东西分组的东西,我输入单词,它给了我主题。
我正在研究一个自然语言处理数据问题,并从中选择了一些关键字作为特征。我想将它们归为一个标题。但我找不到任何方法或算法来做到这一点?我尝试使用 MALLET 进行主题建模。它将相似的词分组到一个集群中。我想要一个标题或主题附加到它们。
有没有办法在一个主题下将相似的单词分组并为其分配一个标题?
有许多不同的功能需要获得一个主题,例如应该属于相机的图像质量相机自拍分辨率。需要将这些东西分组的东西,我输入单词,它给了我主题。
如果您已经选择了要分组的关键字,为什么不编写一个函数来查找列表中所有出现的单词并将其替换为您的核心单词呢?
您所描述的听起来像是更高级的stemming版本。