易于解释的视觉有趣的统计概念

机器算法验证 自习 数据可视化
2022-02-01 07:17:12

我在 Math Stack Exchange 上注意到了一个很棒的帖子,它突出了许多视觉上非常有趣的数学概念。我很想看到任何人都非常清楚地说明统计概念的图形/GIF(特别是那些可能成为刚开始学习统计的学生的动力的那些)。

我正在考虑高尔顿板的视频如何使 CLT 立即相关。

4个回答

我喜欢说明不同模式如何具有相似相关性的图像。以下来自维基百科关于相关性和依赖性的文章

在此处输入图像描述

Anscombe 的四重奏,相关系数约为0.816

在此处输入图像描述

辛普森悖论

在分析一个或多个自变量与因变量之间的关系时忽略关键变量时出现的一种现象。例如,这表明房屋拥有的卧室越多,房价越低

平均房价与平均卧室数量

这似乎违反直觉,并且可以通过在同一图表上绘制构成每个区域平均值的所有数据点来轻松解决。在这里,当同时观察邻里变量时,更多的卧室正确地表明了更昂贵的房屋:

房价与卧室数量

如果您想阅读有关上述示例的更多信息并获得比我能够提供的更好的解释,请单击此处

当今非常重要且非常容易可视化的最有趣的概念之一是“过度拟合”。下面的绿色分类器提供了一个明显的过度拟合示例[编辑:“绿色分类器由分隔红色和蓝色数据点的非常摆动的线给出” - Nick Cox]。

来自维基百科

在此处输入图像描述

X 的平均值为 54,SD 为 17,Y 的平均值分别为 48 和 27,并且两者之间的相关性为 -0.06 的二维数据集如何?

介绍Anscombosaurus :

在此处输入图像描述

和它的伙伴,十二数据龙

在此处输入图像描述