您似乎在您的问题中假设正态分布的概念在确定分布之前就已经存在,人们试图弄清楚它是什么。我不清楚这将如何工作。[编辑:至少有一种感觉,我们可能会认为这是“搜索分布”,但不是“搜索描述大量现象的分布”]
不是这种情况; 该分布在称为正态分布之前就已为人所知。
您如何向这样的人证明所有正态分布数据的概率密度函数具有钟形
正态分布函数是具有通常称为“钟形”的东西——所有正态分布都具有相同的“形状”(从某种意义上说,它们仅在规模和位置上有所不同)。
数据在分布上看起来或多或少是“钟形”,但这并不正常。许多非正态分布看起来类似“钟形”。
从中提取数据的实际人口分布可能从来都不是真正的正态分布,尽管它有时是一个相当合理的近似值。
这通常适用于我们应用于现实世界中事物的几乎所有分布——它们是模型,而不是关于世界的事实。[例如,如果我们做出某些假设(泊松过程的假设),我们可以推导出泊松分布——一种广泛使用的分布。但是这些假设是否曾经完全满足?一般来说,我们能说的最好的(在正确的情况下)是它们几乎是真的。]
我们实际上认为正态分布的数据是什么?遵循正态分布的概率模式的数据,还是其他?
是的,要真正服从正态分布,从中抽取样本的总体必须具有具有正态分布的精确函数形式的分布。因此,任何有限人口都不能是正态的。必然有界的变量不可能是正态的(例如,特定任务所花费的时间、特定事物的长度不能为负数,因此它们实际上不可能是正态分布的)。
可能更直观的是,正态分布数据的概率函数具有等腰三角形的形状
我不明白为什么这必然更直观。这当然更简单。
当第一次开发误差分布模型(特别是早期的天文学)时,数学家考虑了与误差分布相关的各种形状(包括早期的三角形分布),但在这项工作的大部分工作中,它是数学(而不是比直觉)使用的。例如,拉普拉斯研究了双指数分布和正态分布(以及其他几个分布)。类似地,高斯几乎在同一时间使用数学来推导它,但与拉普拉斯所做的考虑不同。
在狭义上,拉普拉斯和高斯考虑“误差分布”,我们可以认为这是“寻找分布”,至少在一段时间内是这样。两者都假设了他们认为重要的错误分布的一些属性(拉普拉斯认为随着时间的推移一系列略有不同的标准)导致不同的分布。
基本上我的问题是为什么正态分布概率密度函数具有钟形而不是其他任何形状?
被称为正常密度函数的事物的函数形式赋予了它这种形状。考虑标准法线(为简单起见;其他所有法线都具有相同的形状,仅在比例和位置上有所不同):
fZ(z)=k⋅e−12z2;−∞<z<∞
(在哪里k只是一个常数,选择使总面积 1)
这定义了每个值的密度值x,所以它完全描述了密度的形状。那个数学对象就是我们贴上“正态分布”标签的东西。这个名字没有什么特别之处。它只是我们附加到发行版的标签。它有很多名字(并且仍然被不同的人称为不同的东西)。
虽然有些人认为正态分布在某种程度上是“常见的”,但实际上只有在特定的情况下,您甚至倾向于将其视为近似值。
分布的发现通常归功于 de Moivre(作为二项式的近似值)。实际上,当他试图逼近二项式系数(/二项式概率)以逼近其他繁琐的计算时,他实际上推导出了函数形式,但是 - 虽然他确实有效地推导出了正态分布的形式 - 他似乎没有考虑过他的近似作为概率分布,尽管一些作者确实建议他这样做。需要一定数量的解释,因此该解释存在差异的余地。
高斯和拉普拉斯在 1800 年代早期确实研究过它。Gauss 在 1809 年写了关于它(与它有关的分布,其平均值是中心的 MLE)和 Laplace 在 1810 年,作为对称随机变量之和分布的近似值。十年后,拉普拉斯给出了中心极限定理的早期形式,用于离散变量和连续变量。
分布的早期名称包括误差定律、误差频率定律,它也以拉普拉斯和高斯命名,有时联合命名。
1870 年代,三位不同的作者(Peirce、Lexis 和 Galton)分别使用“正态”一词来描述分布,第一位在 1873 年,另外两位在 1877 年。这是在 Gauss 和拉普拉斯,是德莫弗近似后的两倍多。高尔顿对它的使用可能是最有影响力的,但他在 1877 年的作品中只使用了一次与它相关的“正常”一词(主要称其为“偏差定律”)。
然而,在 1880 年代,高尔顿多次使用与分布相关的形容词“正态”(例如 1889 年的“正态曲线”),他反过来对英国后来的统计学家(尤其是卡尔·皮尔森)。他没有说他为什么用这种方式使用“正常”一词,但大概是指“典型”或“通常”的意思。
卡尔·皮尔森(Karl Pearson)似乎第一次明确使用了“正态分布”这个短语。他当然在 1894 年使用过它,尽管他声称很久以前就使用过它(我会谨慎看待这一说法)。
参考:
米勒,杰夫
“一些数学词汇的最早已知用途:”
正态分布(John Aldrich 的条目)
http://jeff560.tripod.com/n.html
(替代:https://mathshistory.st-andrews。 ac.uk/Miller/mathword/n/)
Stahl, Saul (2006),
“正态分布的演变”,
数学杂志,卷。79,第 2 期(四月),第 96-113 页
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
正态分布,(2016 年 8 月 1 日)。
在维基百科,免费百科全书。
检索于 2016 年 8 月 3 日 12:02,来自
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History
Hald, A (2007),
“De Moivre 对二项式的正态近似,1733 年及其推广”,
在:从伯努利到费舍尔的参数统计推断的历史,1713-1935 年;第 17-24 页
[您可能会注意到这些来源之间关于他们对 de Moivre 的描述存在重大差异]