这个主题实际上很难用谷歌搜索,因为在这个领域中“树”已经被重载来引用决策树。
我有兴趣让学习算法生成代码,例如在 Microsoft Power BI 的功能中使用自然语言(“Q&A”,以前的“InfoNav”)查询数据库。
显然,自然语言和数据库查询都可以表示为文本,所以我们有一个很好的答案:循环神经网络。
但是,如果我们将 SQL 查询作为一种查询,那么如果我们查看它们的AST表示而不是它们的文本表示,那么直观地可以简化实际的预测工作。
如果我们要预测 AST 表示,语言关键字将突然不再阻塞要预测的输出向量,因为我们可以使用描述语言的BNF并将每个节点的决策表示为整数等与其他信息(例如数字/字符串文字的内容)。
有没有标准的方法来解决这个问题?这里有哪些最佳实践?
维基百科有一篇关于结构化预测的文章,但显然它是基于理论和学术的,甚至特色文章也相当古老(对于 ML),所以我倾向于认为它不一定能告诉我很多关于当前最佳实践的信息,如果有的话...