高斯函数从何而来?

机器算法验证 正态分布
2022-03-13 18:07:08

我在谷歌上阅读了无数页,找不到满意的答案。我也读过http://castatistics.wikispaces.com/file/view/normal+der..pdf,但我怀疑这是高斯函数的最初动机。我目前是一名本科生,我的教科书只告诉我函数 f(x) = ae -(x - b)^2/c 用作正态曲线的概率密度函数。但是我的教科书没有给我任何关于这个函数实际来自哪里的线索。开发这种功能的最初动机是什么?有人可以提供一个证据,证明我实际上可以理解带有明确标记的步骤吗?我对基本微积分有一定的了解,而且在统计学方面我是初学者。请不要复杂的证明。

2个回答

最初的推导来自 de Moivre,他将其用作二项式的近似值。它后来在其他情况下多次独立派生。

http://en.wikipedia.org/wiki/Abraham_de_Moivre#Probability

http://en.wikipedia.org/wiki/De_Moivre%E2%80%93Laplace_theorem

正态分布是当测量由大量以相同方式分布的“噪声”分量组成时所期望的分布。

这个原理有时会用一个使用骰子的例子来说明。多次掷骰子并绘制数值分布图。假设骰子是公平的,你最终会得到一个从 1 到 6 的(离散的)均匀分布。现在再做一次,但使用两个骰子。你得到一个从 2 到 12 的逐步三角形分布。添加第三个骰子,分布有点钟形,步数很小,因为现在有 17 个不同的可能值。四个骰子的分布看起来非常像正态分布,而骰子的数量是无限的,它是一个正态分布。一个分布需要 4 到无限数量的骰子(我经常说 12),而这种分布实际上与正态公式给出的正态分布无法区分。

许多生物和物理测量具有许多不准确和噪声源,因此这些测量的分布将近似于正态,只要这些组件的分布相似。如果一个噪声分量远大于其他噪声分量,则不会产生正态分布。想象一下,如果一组骰子中的一个骰子的面标记为 100 到 600 而不是 1 到 6。该骰子将支配其他 11 个骰子,因此它们的顶面总和的分布将是(离散)的明显混合均匀的 100 到 600 和几乎连续的接近正态的 11 到 66。分量变化的分布必须是相似的,即使它们不需要是正态的(如果有很多)。

(值得注意的是,许多可变性来源具有对数分布,因此生物学和物理学中的许多测量值比正态更接近对数正态。)