机器算法验证 - 在工程测试中何时使用总体与样本标准差感到困惑 - 吾爱随笔录

在工程测试中何时使用总体与样本标准差感到困惑

机器算法验证标准差样本人口工程统计

2022-04-04 07:06:13

当我对某事进行测试（例如 10 次试验）并想找到所有 10 次试验的标准差时，我会感到困惑是应该使用样本标准差还是总体标准差。我最初的想法是样本标准差，因为我可以再进行 10 次试验，现在有更多的数据点，因此永远不会有完整的总体。

我在网上看到的很多例子都涉及学生成绩或财务申请（我从不处理），但是当可以运行更多测试并拥有更多数据点但使用所有您必须获得标准偏差的数据点。

2个回答

这两种形式的标准偏差与两种不同类型的可变性有关。一个是一组数字中值的可变性，一个是对从中抽取数字样本的总体可变性的估计。

如果您手头的数字是整个总体，则总体标准差是相关的，而当数字是更大总体的样本时，样本标准差是相关的。

对于任何给定的数字集，样本标准偏差大于总体标准偏差，因为涉及额外的不确定性：抽样产生的不确定性。有关更多信息，请参阅此内容：计算标准偏差时除以 $n-1$

例如，1、2、3、4、5的总体标准差约为1.41，样本标准差约为1.58。

我的问题与 pnd1987 的问题类似。我希望使用标准偏差来评估测量的可重复性。假设我一遍又一遍地测量一件稳定的东西。一个完美的测量仪器（有一个完美的操作员）会一遍又一遍地给出相同的数字。取而代之的是变化，让我们假设平均值存在正态分布。

我们想通过该正态分布的 SD 评估测量重复性。但是我们一次只进行 N 次测量，并希望这 N 次的 SD 可以估计正态分布的 SD。随着 N 的增加，sampleSD 和 populationSD 都收敛到分布的 SD，但是对于小的 N，比如 5，我们只能得到分布 SD 的弱估计。PopulationSD 给出的估计值明显比 sampleSD 差，因为当 N=1 时，populationSD 给出了荒谬的值 0，而 sampleSD 是正确不确定的。但是，sampleSD 不能正确估计分布的 SD。也就是说，如果我们测量 N 次并获取样本 SD，然后再测量 N 次并获取样本 SD，一遍又一遍，并平均所有样本 SD，该平均值不会收敛到分布的 SD。对于 N=5，它收敛到大约 0.94 倍分布 SD。（这里一定有一个小定理。）SampleSD 并没有完全按照它所说的去做。

如果测量变化是正态分布的，那么知道分布的 SD 会非常好。例如，我们可以确定要进行多少次测量才能容忍变化。N 次测量的平均值也呈正态分布，但标准偏差为原始分布的 1/sqrt(N) 倍。

补充说明：这个定理不是那么少——科克伦定理

其它你可能感兴趣的问题

上一篇概率校准和 Brier 分数下一篇明显变量和观察变量之间的差异