我正在尝试创建一个能够对陈述的真实性进行合理猜测的 AI。然而...
人类:“证明不存在比十亿大一的数字。”
AI:“数字 1 是真的吗?不是。我有 1% 的把握这个说法是正确的。”
AI:“数字 2 是真的吗?不是。我有 2% 的把握这个说法是正确的。”
...
AI:“数字 999,999 是真的吗?不是。我 99.99% 确信这个说法是正确的。”
AI:“经过大量例子的测试,我认为这个说法是正确的。”
人类:“这个说法是错误的:十亿零一。”
你认为哪里出了问题?
我正在尝试创建一个能够对陈述的真实性进行合理猜测的 AI。然而...
人类:“证明不存在比十亿大一的数字。”
AI:“数字 1 是真的吗?不是。我有 1% 的把握这个说法是正确的。”
AI:“数字 2 是真的吗?不是。我有 2% 的把握这个说法是正确的。”
...
AI:“数字 999,999 是真的吗?不是。我 99.99% 确信这个说法是正确的。”
AI:“经过大量例子的测试,我认为这个说法是正确的。”
人类:“这个说法是错误的:十亿零一。”
你认为哪里出了问题?
我不认为“尝试所有数字”的方法很有代表性,因为我不确定使用这种方法的代理是否可以通过任何方式考虑为 AI。
仅检查数字以试图证明该陈述是没有“智慧”的。被认为是智能的代理应该应用更智能的方法。
这变得更加明显,因为该问题旨在利用代理策略缺乏可扩展性。如果问题是“证明不存在比 5 大一的数字”,那么智能体将毫无困难地找到正确答案。