一方面,我有回归均值,另一方面我有赌徒谬误。
赌徒谬误被 Miller 和 Sanjurjo (2019) 定义为“错误地认为随机序列具有系统性的逆转趋势,即类似结果的条纹更有可能结束而不是继续。” 例如,连续多次正面朝上的硬币将被认为在下一次试验中反面的可能性不成比例。
我在上一场比赛中表现不错,根据回归均值,下一场比赛我的表现可能会更差。
但根据赌徒谬误:考虑以下两个概率,假设硬币公平
- 20 个正面的概率,那么 1 个尾巴 =
- 20 个正面的概率,那么 1 个正面 =
然后...
考虑一个简单的例子:一个班级的学生对一个主题进行 100 项真/假测试。假设所有学生在所有问题上随机选择。然后,每个学生的分数将是一组独立且同分布的随机变量中的一个的实现,预期平均值为 50。
当然,有些学生的分数会大大高于 50,而有些学生的分数会大大低于 50,这只是偶然。如果只选择得分最高的 10% 的学生并给他们第二次测试,他们再次在所有项目上随机选择,则平均分数将再次接近 50。
因此,这些学生的平均值将一直“回归”到所有参加原始测试的学生的平均值。无论学生在最初的考试中得分多少,他们在第二次考试中得分的最佳预测是 50。
特别是如果一个人只选择得分最高的 10% 的学生并给他们第二次测试,他们再次在所有项目上随机选择,平均分数将再次接近 50。
根据赌徒的谬误,难道不应该期望得分的概率相同,而不一定更可能接近 50?
Miller, JB 和 Sanjurjo, A. (2019)。当样本量被忽略时,经验如何证实赌徒的谬误。