Russell 和 Norvig 的书(第 3 版)描述了这两种算法(第 4.1.1 节,第 122 页),这本书是您在研究人工智能中的搜索算法时通常应该使用的参考书。我熟悉模拟退火(SA),因为我过去实现它是为了解决组合问题,但我对随机爬山(SHC)不是很熟悉,所以让我引用书中描述 SHC 的部分.
随机爬山从上坡动作中随机选择;选择的概率会随着上坡移动的陡峭程度而变化。这通常比最陡峭的上升收敛得更慢,但在某些州的情况下,它会找到更好的解决方案。
因此,SHC 随机选择一个“上坡移动”,即改进目标函数的移动(例如,如果您试图解决旅行商问题,“上坡移动”可能是对当前哈密顿循环的任何改变,一种解决方案,以便新的 Halmitonian 循环具有更短的成本)在上坡移动中(因此在一些改进目标的移动中)。
在模拟退火中,您执行一些移动。如果这一举措导致了更好的解决方案,那么您始终保留更好的解决方案。如果它导致一个更糟糕的解决方案,你以一定的概率接受那个更糟糕的解决方案。还有其他细节,例如您如何接受更差的解决方案(您可以在 Russell 和 Norvig 的书中找到),但这应该已经阐明 SA 与 SHC 不同:SA 可以接受更差的解决方案以逃避局部最小值,而 SHC 只接受上坡运动。