我是进化算法的新手。我研究过协方差矩阵适应进化策略。我不擅长统计。所以你能用简单的语言解释一下吗(我的意思不是太多的方程)
- 什么是 CMA-ES?
- 它是如何工作的?
- 为什么它优于其他策略?
我是进化算法的新手。我研究过协方差矩阵适应进化策略。我不擅长统计。所以你能用简单的语言解释一下吗(我的意思不是太多的方程)
根据上面链接到回答 (1) 的维基百科页面,这是梯度下降的另一种形式(如果您需要更多包含大量图片的信息,那么如果您用谷歌搜索,可以找到很多文章——抱歉,显然新海报只有 2 个网址,所以我'必须告诉你搜索而不是指向特定的)所以它用于优化目标函数。通常这意味着我想找到我感兴趣的函数的最大值或最小值。
不是要和其他海报分道扬镳,而是这个算法如何统计是一个语义问题。建议基于最大似然参数和协方差(更高维度的方差 - 空间中样本的分布)收敛(出于我们的考虑,也就是说该方法有效)用作更新规则的一部分该算法确定如何最好地进行下一次迭代。新点也是从多元正态分布中采样的。这是一个概率模型。类似地,正如维基百科指出的那样,这种方法与主成分分析相似,但并不完全相同。所以从我的角度来看,这似乎是相当统计的,但这可能又是主观的。
我想第二个 wiki 链接和上述地址 (2) 的一部分,但可能不够充分,所以如果您需要更多信息,请随时跟进。短处是,如果有一个最优值,这个过程会在问题空间中搜索它,并最终在模型假设下找到它。您需要测试这些假设,因为偏离它们可能是该方法在解决您的问题时的主要后果以及效果如何。
但是,我同意另一张海报,您可能会在Meta Optimize之类的网站上找到更多甚至更好的答案,这是一个专门针对机器学习的社区,但是许多统计学家确实致力于学习问题,所以我希望其他人会权衡在以及。
至于(3)不一定是更好的方法。它是一种不同于其他方法(例如具有梯度下降的前馈神经网络)的一组假设的方法,特别是这种方法适用于非线性或非凸问题。在继续使用之前,您需要再次测试您正在处理的问题是否适合此方法。否则,您可能会得到一个不太理想的解决方案,或者更糟的是垃圾中的垃圾。如果您的问题是非线性或非凸的,那就去解决它,否则您可能需要考虑使用不同的方法。维基百科文章“实践中的性能”的一部分可以帮助您确定这是否适合您正在处理的问题。
当您不想看到太多表达式时,您提到了一些数学恐惧症。因此,您可能不知道您正在处理的数据/问题的某些属性。你愿意分享一些更具体的细节还是只是笼统地问?
希望这会有所帮助。请让我知道是否有任何后续行动。祝你好运。
这是一种优化算法:它试图找到函数的最小值。据说它是高维非凸问题的最佳优化算法之一(超过 5 或 10 个要优化的参数)。
名称中的协方差一词对统计界来说有点误导:算法中不涉及统计。因此,此站点可能不是寻求帮助的最佳场所。
我无法提供更多信息,但维基百科页面非常清楚。