假设我有上下文无关语法 (CFG)抽出该语言的单词。我想要一个机器学习系统,它可以检测一个单词来自或不。它可以访问来自的流不断地产生单词随机。在这种情况下,系统只能用正例进行训练。该系统还可以访问验证器. 系统(如果它选择)可以生成字符串并验证字符串是否在或不。但是,系统可能只是作弊并只使用验证器,因此在测试阶段,它会被禁用(在学习阶段,它会尽可能多地使用验证器)。而且,可以增加和改变,系统应该适应这种变化。
例如,让我们考虑这个正则表达式(正则表达式是 CFG):
这种语言只产生一个字符串的长度均匀。假设我将正则表达式修改为. 该系统应该适应识别这种新语言。
在我的设计中我应该考虑什么样的方法/方法?