如何从一组单词中造出有意义的句子?

人工智能 机器学习 自然语言处理
2021-11-11 12:24:55

我有一组使用 LDA 生成的主题,例如 {code, language, test, write, function}, {class, public, method, string, int} 等,我想使用 api 或库从这些单词中制作有意义的句子/句子. 如何使用 NLTK 和(或)机器学习来实现这一点?关于我应该如何解决这个问题的任何建议?

1个回答

你如何定义“有意义”?一般来说,你会从概念和意义开始,然后使用词汇项目(单词)在句法结构中实现它们。你似乎想以某种方式从中间开始。

要将语义表示转换为有效句子,您将使用生成器;这些通常基于语法。存在使用语法,随机填写单词并创建句法结构良好的句子的示例;然而,它们往往是相当荒谬或毫无意义的。看看这个描述 Syntax Construction Kit 的网站。作者 Mark Rosenfelder 链接到许多玩具程序,它们正是这样做的。只需将他的词典替换为您的 LDA 流程创建的单词列表即可。例如,参见这个基于生成语法的生成器