计算方差的公式在分母中
我一直想知道为什么。然而,阅读和观看一些关于“为什么”的好视频,似乎是总体方差的一个很好的无偏估计。而低估和高估总体方差。
我很想知道,在没有计算机的时代,这个选择究竟是如何做出的?是否有实际的数学证据证明这一点,或者这纯粹是经验和统计学家手工进行了大量计算以提出当时的“最佳解释”?
统计学家是如何在 19 世纪初借助计算机得出这个公式的?手动还是它比眼睛看到的更多?
计算方差的公式在分母中
我一直想知道为什么。然而,阅读和观看一些关于“为什么”的好视频,似乎是总体方差的一个很好的无偏估计。而低估和高估总体方差。
我很想知道,在没有计算机的时代,这个选择究竟是如何做出的?是否有实际的数学证据证明这一点,或者这纯粹是经验和统计学家手工进行了大量计算以提出当时的“最佳解释”?
统计学家是如何在 19 世纪初借助计算机得出这个公式的?手动还是它比眼睛看到的更多?
我见过的大多数证明都很简单,以至于高斯(不管他怎么做)可能发现证明起来很容易。
我一直在寻找可以将您链接到的关于 CV 的推导(有许多指向场外证明的链接,包括此处的答案中的至少一个),但我没有在 CV 中找到一个几个搜索,所以为了完整起见,我会给出一个简单的。鉴于其简单性,很容易看出人们将如何开始使用通常称为Bessel 校正的方法。
这将作为假设知识,并假设前几个基本方差属性是已知的。
根据 Weisstein 的《数学世界》,它于 1823 年由 Gauss 首次证明。参考是 Gauss' Werke 的第 4 卷,可在https://archive.org/details/werkecarlf04gausrich阅读。相关页面似乎是47-49。似乎高斯调查了这个问题并提出了一个证明。我不看拉丁文,但文中有德文摘要。第 103-104 页解释了他的所作所为(编辑:我添加了粗略的翻译):
Allein da man nicht berechtigt ist, die sichersten Werthe fuer die wahren Werthe selbst zu halten, so ueberzeugt man sich leicht, dass man durch dieses Verfahren allemal den wahrscheinlichsten und mittleren又名 sie wirklich besitzen。[但是由于人们无权将最可能的值视为实际值,因此人们可以很容易地说服自己,必须始终发现最可能的误差和平均误差太小,因此给定的结果拥有比他们真正拥有的更高的准确性。]
由此看来,众所周知,样本方差是对总体方差的有偏估计。文章接着说,两者之间的差异通常被忽略,因为样本量是否足够大并不重要。然后它说:
Der Verfasser hat daher diesen Gegenstand eine besondere Untersuchung unterworfen, die zu einem sehr Merkwuerdigen hoechst einfachen Resultate gefuehrt hat。Man braucht nemlich den nach dem angezeigten fahlerhaften Verfahren gefundenen mittleren Fehler, um ihn in die Richtigen zu verwandeln, nur mit
zu multiplieren,wo die Anzahl der beobachtungen(观察次数)和 die Anzahl der unbekannten groessen(未知数) bedeutet。[因此作者对这个物体进行了专门的研究,得出了一个非常奇怪和极其简单的结果。即,只需将上述错误过程发现的平均误差乘以(给定表达式)即可将其变为正确的误差,其中是观测数,是未知量数。]
所以如果这确实是第一次发现修正,那么似乎是通过高斯的巧妙计算找到的,但人们已经意识到需要进行一些修正,所以在此之前也许其他人可以凭经验找到它. 或者可能以前的作者不关心得出确切的答案,因为他们无论如何都在使用相当大的数据集。
摘要:手册,但人们已经知道分母中不太正确。
对我来说,一种直觉是
那是,
实际上证明上述等式需要一些代数(这个代数与上面@Glen_b 的答案非常相似)。但假设它是真的,我们可以重新排列得到:
对我来说,另一个直觉是使用而不是会引入偏见。而这个偏差正好等于。