预测树结构

机器算法验证 循环神经网络 序列分析 结构化预测
2022-03-30 05:14:39

这个主题实际上很难用谷歌搜索,因为在这个领域中“树”已经被重载来引用决策树。

我有兴趣让学习算法生成代码,例如在 Microsoft Power BI 的功能中使用自然语言(“Q&A”,以前的“InfoNav”)查询数据库。

显然,自然语言和数据库查询都可以表示为文本,所以我们有一个很好的答案:循环神经网络。

但是,如果我们将 SQL 查询作为一种查询,那么如果我们查看它们的AST表示而不是它们的文本表示,那么直观地可以简化实际的预测工作。

如果我们要预测 AST 表示,语言关键字将突然不再阻塞要预测的输出向量,因为我们可以使用描述语言的BNF并将每个节点的决策表示为整数等与其他信息(例如数字/字符串文字的内容)。

有没有标准的方法来解决这个问题?这里有哪些最佳实践?

维基百科有一篇关于结构化预测的文章,但显然它是基于理论和学术的,甚至特色文章也相当古老(对于 ML),所以我倾向于认为它不一定能告诉我很多关于当前最佳实践的信息,如果有的话...

1个回答

我知道现在回答为时已晚,但仍然在下面找到:

我认为您正在寻找自然语言到 SQL 语句类型的问题陈述,最近几个月开发的解决方案很少见下表:

  1. SEQ2SQL 的 SEQ2SEQ 方法
  2. SQLNET https://arxiv.org/pdf/1711.04436.pdf

更多: https ://github.com/sriniyer/nl2sql

享受!