任何人都知道有关使用 RL 控制多个单元的资源(论文、文章,尤其是存储库)。
控制的单位不应该是固定的,例如在实时战略中,代理建立各种单位(工人、士兵......)然后控制它们。在游戏过程中,各种单位可能会死亡并建造新的单位。
我认为当代的一个很好的例子是 AlphaStar,而 OpenAI Five 只控制一个代理。这可能是不正确的,因为我从未玩过这些游戏。
任何人都知道有关使用 RL 控制多个单元的资源(论文、文章,尤其是存储库)。
控制的单位不应该是固定的,例如在实时战略中,代理建立各种单位(工人、士兵......)然后控制它们。在游戏过程中,各种单位可能会死亡并建造新的单位。
我认为当代的一个很好的例子是 AlphaStar,而 OpenAI Five 只控制一个代理。这可能是不正确的,因为我从未玩过这些游戏。