我有一组主题,每个主题都由一组单词组成。我想用这些词造出有意义的英语句子。每个主题由 5 到 10 个单词组成,这些单词彼此相关,就像{code, language, test, write and function}是{class, public, method, string, int}两个集合。我想使用 API 从这些单词集中生成一个句子。
如何从给定的一组单词中造出有意义的英语句子?
人工智能
机器学习
自然语言处理
2021-11-05 12:29:11
1个回答
两种方法:
- 朴素贝叶斯
- 长短期记忆体
在整个数据集上训练朴素贝叶斯,学习给定单词的下一个单词的概率。
你甚至可以使用任何 LSTM 方法,但我敢打赌朴素贝叶斯。
例如:
文字:你好,你好吗,你好,你好,你好吗?
根据当前单词获得下一个单词的建议 - 你好
p(怎么样|你好)= 3/4
p(不|你好)= 1/4
取 argmax 的概率。
还要记住要平滑,并在庞大的数据集上进行训练。训练只是事先找到概率。
希望能帮助到你 ;)