机器算法验证 - 预测树结构 - 吾爱随笔录

这个主题实际上很难用谷歌搜索，因为在这个领域中“树”已经被重载来引用决策树。

我有兴趣让学习算法生成代码，例如在 Microsoft Power BI 的功能中使用自然语言（“Q&A”，以前的“InfoNav”）查询数据库。

显然，自然语言和数据库查询都可以表示为文本，所以我们有一个很好的答案：循环神经网络。

但是，如果我们将 SQL 查询作为一种查询，那么如果我们查看它们的AST表示而不是它们的文本表示，那么直观地可以简化实际的预测工作。

如果我们要预测 AST 表示，语言关键字将突然不再阻塞要预测的输出向量，因为我们可以使用描述语言的BNF并将每个节点的决策表示为整数等与其他信息（例如数字/字符串文字的内容）。

有没有标准的方法来解决这个问题？这里有哪些最佳实践？

维基百科有一篇关于结构化预测的文章，但显然它是基于理论和学术的，甚至特色文章也相当古老（对于 ML），所以我倾向于认为它不一定能告诉我很多关于当前最佳实践的信息，如果有的话...