在这篇文章中,作者声称仅通过新颖性(没有明确的目标)来引导进化比使用明确的目标可以更好地解决问题。换句话说,使用新颖性度量作为遗传算法的适应度函数比目标导向的适应度函数效果更好。这怎么可能?
新奇搜索如何工作?
人工智能
遗传算法
进化算法
新奇搜索
2021-11-01 20:29:38
2个回答
正如对此 AI SE 问题的回答所解释的那样,GA 是“满足者”而不是“优化者”,并且倾向于不探索搜索空间的“外围”区域。相反,根据适应度函数,人口倾向于聚集在“相当好”的区域中。
相比之下,我认为这种想法是新颖性提供了一种动态适应性,倾向于将人口推离先前发现的区域。
新颖性搜索通过某些与领域相关的新颖性定义来选择“新颖行为”。例如,迷宫解决领域的新颖性可能是“探索路线的差异”。最终,将找到通过迷宫的所有可能路线的网络,然后您可以选择最快的。这比一个天真的“目标”要好得多,比如到目标的距离,这很容易导致永远无法解决迷宫的局部最优。
从放弃目标:通过单独寻找新奇而进化(强调我的):
在新颖性搜索中,进化不是使用传统的目标函数来衡量整体进展,而是采用一种称为新颖性度量的行为新颖性度量。实际上,由这种度量引导的搜索明确地执行了自然进化被动地所做的事情,即逐渐积累提升复杂性阶梯的新形式。
例如,在 Biped 运动域中,最初的尝试可能会简单地失败。新颖性指标将奖励以不同的方式简单地跌倒,无论它是否更接近客观行为。相比之下,目标函数可能会明确奖励跌得最远的地方,这可能不会导致步行的最终目标,因此可以举例说明具有欺骗性的局部最优值。相反,在寻找新颖性时,会保留一组代表最新颖发现的实例。然后从这些代表性行为中跳出进一步的搜索。在发现了几种跌倒的方法后,唯一获得奖励的方法就是找到一种不会立即跌倒的行为。这样,行为复杂性自下而上上升。最终,为了做一些新的事情,两足动物必须成功地行走一段距离,即使这不是一个目标。