旅行商问题变体:选择哪种算法?

人工智能 机器学习 强化学习 遗传算法 组合学
2021-10-28 15:18:31

我有一个工业问题,我试图将其转换为 3D 欧几里得空间中的旅行推销员问题 (TSP)。存在物理限制,这意味着某些子路径根据简单规则可能有效也可能无效。

鉴于存在规则/模型/约束,哪种算法最适合处理 TSP?

例如,可以使用遗传算法来完成,但我看到如何合并这些规则的唯一方法是将它们以某种方式包含在适应度函数中。但我觉得应该有更合适的方法。

强化 Q 学习或其他算法是否更适合基于规则的欧几里得 TSP?

1个回答

如果您有很多规则,那么您应该能够为 A* 提出很多启发式方法。如果我是你,我会先尝试 A*,然后尽可能多地提出启发式方法。您还可以使用 Deep Q 学习。我不认为您只想将坐标放入 Deep Q 网络。你想要一个更简单的表示。我可能会给节点符号标识符,如稀疏矩阵、整数或 sigmoid,然后制作损失函数以反映从一个节点移动到另一个节点的实际成本,并将高成本归因于非法移动。