Nassim Taleb 关于 AI 无法准确预测某些类型的分布是否正确?

人工智能 机器学习 人工智能设计 可能性 统计人工智能
2021-11-15 23:17:24

所以 Taleb 有两种启发式方法来概括地描述数据分布。一个是 Mediocristan,它基本上意味着处于高斯分布上的事物,例如人的身高和/或体重。

另一个称为 Extremistan,它描述了更像帕累托或肥尾分布。一个例子是财富分配,1% 的人拥有 50% 的财富或接近的财富,因此从有限的数据集中进行预测要困难得多,甚至是不可能的。这是因为您可以将单个样本添加到您的数据集中,并且后果如此之大以至于它破坏了模型,或者影响如此之大以至于它抵消了先前准确预测的任何好处。事实上,这就是他声称在股票市场上赚钱的方式,因为其他人都在使用糟糕的高斯分布模型来预测市场,这实际上可以在很短的时间内起作用,但当出现问题时,他们就真的走了错误会导致您在市场上出现净亏损。

我发现这个关于 Taleb 被问及 AI 的视频。他的主张是,人工智能(也)不适用于陷入极端主义的事物。

他是对的吗?即使有了人工智能,有些事情会不会天生就不可预测?

这是我指的视频https://youtu.be/B2-QCv-hChY?t=43m08s

1个回答

是和不是!

机器学习系统不能处理极端事件并没有内在的原因。作为一个简单的版本,您可以从数据中学习Weibull 分布或另一个极值模型的参数。

更大的问题是已知未知与未知未知。如果您知道罕见事件是可能的(例如地震预测),您可以将这些知识整合到您开发的模型中,并且您将获得在该领域与人类一样有效或更好的东西。如果您知道可能发生的罕见事件(例如,相关住房违约导致的股市崩盘),那么您的模型也将反映这一点。

我倾向于认为塔勒布在这里有点不公平:人工智能无法处理这类事件正是因为它的创造者(我们)无法处理它们!如果我们知道它们是可能的,那么我们就可以很好地处理它们,人工智能也可以。