我的父亲是一个数学爱好者,但对统计不太感兴趣。尝试说明一些精彩的统计数据会很巧妙, CLT 是一个主要的候选者。您如何将中心极限定理的数学美感和影响传达给非统计学家?
您如何向非统计学家传达中心极限定理的美妙之处?
我最喜欢 CLT 的地方是它不适用的情况——这让我希望生活比高斯曲线所暗示的更有趣。所以向他展示柯西分布。
通常,当数学家谈论概率时,他们从已知的概率分布开始,然后谈论事件的概率。中心极限定理的真正价值在于它允许我们在不知道真实分布的情况下使用正态分布作为近似值。你可以问你父亲一个标准的统计问题(但表述为数学),如果数据来自具有均值 mu 和 sd sigma 的分布,则样本均值大于给定值的概率是多少,然后看看是否他假设一个分布(然后你说我们不知道)或说他需要知道分布。然后你可以证明我们可以在很多情况下使用 CLT 来近似答案。
为了将数学与统计数据进行比较,我喜欢使用积分的均值定理(它表示,对于从 a 到 b 的积分,存在一个从 a 到 b 的具有相同面积的矩形,矩形的高度是曲线)。数学家看着这个定理说“很酷,我可以使用积分来计算平均值”,而统计学家看着同一个定理并说“很酷,我可以使用平均值来计算积分”。
实际上,我的办公室里有关于中值定理和 CLT(以及贝叶斯定理)的十字绣壁挂。
我喜欢通过“课堂”练习来演示采样变化和本质上的中心极限定理。假设 100 名学生的班级中的每个人都在一张纸上写下他们的年龄。在我计算了平均值之后,所有的纸都是相同的尺寸并以相同的方式折叠。这是人口,我计算平均年龄。然后每个学生随机选择 10 张纸,写下年龄并放回书包。(S)他计算平均值并将袋子传递给下一个学生。最终,我们有 100 个样本,每个样本包含 10 个学生,每个样本都估计了我们可以通过直方图和一些描述性统计数据来描述的总体均值。
然后,我们这次使用一组 100 条“意见”重复演示,这些“意见”复制了最近民意调查中的一些是/否问题,例如,如果明天召开(英国将军)选举,您是否考虑投票给英国国家党。学生们对其中的 10 个意见进行抽样。
最后,我们用连续数据和二进制数据演示了采样变化、中心极限定理等。