我可以将我得到的用户输入分类为自由文本吗?

人工智能 自然语言处理
2021-11-04 12:53:01

我正在做一个项目,其中我将用户的输入作为自由文本,并尝试将文本与用户可能的意思联系起来。我尝试过将文本标记为标记的斯坦福 NLP,但我无法对输入进行分类。例如,用户可能正在与某人打招呼或分享他面临的一些问题。如果他正在分享一些问题,我也需要对问题进行分类。

有人可以帮我从哪里开始吗?

1个回答

您是否尝试过NLTK,您正在寻找的是本书的第 6 章。基本上你需要做的是:

  • 标记用户输入。
  • 从标记化的单词中提取向量集。
  • 使用一些给定的文本和相同的向量集训练您的模型。

您可以使用您的模型对文档进行分类。

另一个建议是,您可以使用输入中的每个单词来使用大型语料库的训练集来评估某个类别,而不是提取向量集,您可以确定它包含所有单词。然后你乘以每个单词在一个类别中的概率来决定文档所属的位置。