介绍
盒子里的AI实验是关于一个超级强的游戏AI,开始时资源比对手低,问题是,如果AI能在最后赢得比赛,就等于逃出监狱。一个典型的例子是计算机国际象棋比赛,其中人工智能玩家只从国王开始,但人类从包括皇后和强大的主教在内的所有 16 个棋子开始。
赢得比赛
如果设置非常不对称,AI 就没有机会赢得比赛。即使人工智能认为领先 100 步,一个国王也无法战胜 16 个对手。但是,如果 AI 以 8 件开始,而人类以 16 件开始,会发生什么?形式化的假设如下所示:
人工智能的优势 x 资源的劣势 = 人力的优势 x 资源的优势
要确定把人工智能关进监狱,人工智能的强度应该很低,而且它的资源也是如此。如果资源低但实力中等,那么AI有一定的机会越狱。如果人工智能拥有最大的力量和最大的资源,那么人类玩家就会遇到严重的问题。
学术界的 AI 文献是否支持这种形式化的预测?