如何实现一个学习识别上下文无关语法的 AI 系统?

人工智能 机器学习 自然语言处理 人工智能设计 语法归纳
2021-10-28 21:09:57

假设我有上下文无关语法 (CFG)L抽出该语言的单词。我想要一个机器学习系统,它可以检测一个单词w来自L或不。它可以访问来自的流L不断地产生单词L随机。在这种情况下,系统只能用正例进行训练。该系统还可以访问验证器L. 系统(如果它选择)可以生成字符串并验证字符串是否在L或不。但是,系统可能只是作弊并只使用验证器,因此在测试阶段,它会被禁用(在学习阶段,它会尽可能多地使用验证器)。而且,L可以增加和改变,系统应该适应这种变化。

例如,让我们考虑这个正则表达式(正则表达式是 CFG):

(aa)

这种语言只产生一个字符串aa的长度均匀。假设我将正则表达式修改为(aa|bb). 该系统应该适应识别这种新语言。

在我的设计中我应该考虑什么样的方法/方法?

1个回答

从语言示例中自动学习语法的过程称为语法归纳由于您提到L可以“增强和更改”,因此使用自适应解析器解决此问题可能是可行的。