人工智能 - 如何实现一个学习识别上下文无关语法的 AI 系统？ - 吾爱随笔录

假设我有上下文无关语法 (CFG) $L$ 抽出该语言的单词。我想要一个机器学习系统，它可以检测一个单词 $w$ 来自 $L$ 或不。它可以访问来自的流 $L$ 不断地产生单词 $L$ 随机。在这种情况下，系统只能用正例进行训练。该系统还可以访问验证器 $L$ . 系统（如果它选择）可以生成字符串并验证字符串是否在 $L$ 或不。但是，系统可能只是作弊并只使用验证器，因此在测试阶段，它会被禁用（在学习阶段，它会尽可能多地使用验证器）。而且， $L$ 可以增加和改变，系统应该适应这种变化。

例如，让我们考虑这个正则表达式（正则表达式是 CFG）：

(a a) *

$(aa)*$

这种语言只产生一个字符串 $aa$ 的长度均匀。假设我将正则表达式修改为 $(aa|bb)*$ . 该系统应该适应识别这种新语言。

在我的设计中我应该考虑什么样的方法/方法？