机器算法验证 - 为什么参数统计比非参数更受欢迎？ - 吾爱随笔录

为什么参数统计比非参数更受欢迎？

机器算法验证回归假设检验数理统计估计非参数

2022-01-25 01:21:56

有人可以向我解释为什么有人会选择参数而不是非参数统计方法进行假设检验或回归分析吗？

在我看来，这就像去漂流并选择不防水的手表，因为你可能不会把它弄湿。为什么不使用适用于各种场合的工具？

4个回答

很少有参数检验和非参数检验实际上具有相同的空值。假设前两个矩存在，参数检验正在测试分布的平均值。Wilcoxon 秩和检验不假设任何矩，而是测试分布的相等性。它的隐含参数是一个奇怪的分布函数，一个样本的观察值低于另一个样本的观察值的概率。您可以谈论在完全指定的相同分布的空值下两个测试之间的比较......但您必须认识到这两个测试正在测试不同的假设。 $t$

参数测试带来的信息及其假设有助于提高测试的能力。当然，这些信息最好是正确的，但如今几乎没有人类知识领域不存在这种初步信息。明确表示“我不想假设任何事情”的一个有趣的例外是非参数方法继续广泛流行的法庭——它对应用程序非常有意义。双关语可能有一个很好的理由，菲利普古德撰写了关于非参数统计和法庭统计的好书。

还有一些测试情况，您无法访问非参数测试所需的微数据。假设你被要求比较两组人，以判断一组人是否比另一组更肥胖。在理想的世界中，您将获得每个人的身高和体重测量值，并且您可以形成按身高分层的排列测试。在一个不太理想（即真实）的世界中，您可能只有每组的平均身高和平均体重（或者可能是样本均值之上这些特征的一些范围或方差）。你最好的办法是计算每组的平均 BMI，如果你只有方法，就比较它们；或者如果您有均值和方差，则假设身高和体重的双变量正态（如果您的样本没有附带一些外部数据，您可能必须从一些外部数据中获取相关性），

正如其他人所写：如果满足前提条件，您的参数测试将比非参数测试更强大。

在你的手表类比中，不防水的手表会更准确，除非它弄湿了。例如，无论哪种方式，您的防水手表都可能会关闭一小时，而非防水手表会准确......并且您需要在漂流旅行后搭乘公共汽车。在这种情况下，随身携带非防水手表并确保它不会被弄湿可能是有意义的。

奖励点：非参数方法并不总是那么容易。是的，替代 at test 的置换测试很简单。但是，对于具有多个双向交互和嵌套随机效应的混合线性模型的非参数替代方案比简单调用nlme(). 我已经这样做了，使用置换检验，根据我的经验，参数和置换检验的 p 值总是非常接近，即使参数模型的残差非常不正常。参数测试通常对偏离其先决条件具有惊人的弹性。

虽然我同意在许多情况下，非参数技术是有利的，但在某些情况下，参数方法更有用。

让我们关注“双样本 t 检验与 Wilcoxon 秩和检验”的讨论（否则我们必须写一整本书）。

对于 2-3 的小组规模，只有 t 检验理论上可以达到低于 5% 的 p 值。在生物学和化学中，这样的小组规模并不少见。当然，在这种情况下使用 t 检验是很微妙的。但也许有总比没有好。（这一点与在完美情况下 t 检验比 Wilcoxon 检验更有效的问题有关）。
由于中心极限定理，对于庞大的组规模，t 检验也可以被视为非参数。
t 检验的结果与均值差的学生置信区间一致。
如果组间方差差异很大，那么 Welch 的 t 检验版本会尝试考虑这一点，而 Wilcoxon 的秩和检验在比较均值时可能会失败（例如，与名义水平相差很大的第一类错误概率））。

在假设检验中，非参数检验通常是在检验不同的假设，这就是为什么不能总是用非参数检验代替参数检验的原因之一。

更一般地说，参数过程提供了一种将结构强加于其他非结构化问题的方法。这非常有用，可以看作是一种简化的启发式方法，而不是相信模型字面上是正确的。以使用某个回归函数（即使假设存在这样的函数是一种参数限制）基于预测变量向量预测连续响应如果我们完全不假设 $y$ $x$ $f$ $f$ 那么我们如何估计这个函数就完全不清楚了。我们需要搜索的可能答案集太大了。但是，如果我们将可能答案的空间限制为（例如）线性函数，那么我们实际上可以开始取得进展。我们不需要相信模型完全成立，我们只是做一个近似，因为需要得到一些答案，无论多么不完美。 $f(x) = \sum_{j=1}^{p} \beta_j x_j$

其它你可能感兴趣的问题

上一篇什么是计算机视觉和卷积神经网络中的平移不变性？下一篇使用 R 完成可重复研究的实质性示例