我正在与当地社区大学一起设计一个为期一年的数据分析课程。该计划旨在让学生准备好处理数据分析、可视化和总结、高级 Excel 技能和 R 编程方面的基本任务。
我想准备一组简短的、真实的例子来说明普通直觉在哪里失败并且统计分析是必要的。我也对“著名的统计失败”感兴趣,但对胜利更感兴趣。所涉及的数据应该是免费的。
我正在寻找的一个完美例子是伯克利歧视案,它说明了辛普森的悖论。相关数据记录在 R 的数据集中。
历史案例也很有趣。John Snow 对 Broad Street 泵数据的分析是可视化力量的一个很好的例子。
在数据收集(选择偏差)等方面有很多失败,医学统计学的文献中充满了。
在变量选择和抽样设计领域出现了很多“统计上的胜利”。我对发生在其他领域的悖论感兴趣——比如分析本身。