什么是稳健的统计检验?什么是强大的统计检验?

机器算法验证 统计学意义 统计能力 强大的
2022-02-01 02:07:26

有些统计检验是稳健的,有些则不是。鲁棒性究竟是什么意思?令人惊讶的是,我在这个网站上找不到这样的问题。

此外,有时会一起讨论测试的稳健性和强大性。直觉上,我无法区分这两个概念。什么是强大的测试?它与稳健的统计检验有何不同?

2个回答

稳健性在统计中具有多种含义,但都意味着对所使用数据类型的变化具有一定的弹性。这听起来可能有点模棱两可,但那是因为稳健性可以指对变化的不同类型的不敏感。例如:

  • 对异常值的鲁棒性
  • 对非正态性的鲁棒性
  • 对非常数方差(或异方差)的鲁棒性

测试的情况下,稳健性通常是指在发生这种变化的情况下测试仍然有效。换句话说,结果是否显着只有在满足测试假设的情况下才有意义。当这些假设被放宽(即不那么重要)时,该测试被认为是稳健的。

测试的功效是在存在真正差异时检测显着差异的能力。特定测试和模型与各种假设一起使用的原因是这些假设简化了问题(例如,需要更少的参数来估计)。测试做出的假设越多,它的稳健性就越低,因为必须满足所有这些假设才能使测试有效。

另一方面,假设较少的测试更稳健。然而,鲁棒性通常以功率为代价,因为要么使用来自输入的更少信息,要么需要估计更多参数。

稳健
的 A检验可以说是稳健的,因为虽然它假设正态分布的组,但它仍然是比较近似正态分布的组的有效检验。t

检验的假设时,Wilcoxon 检验的效力较低,但它更稳健,因为它不假设潜在分布,因此对非正态数据有效。它的功效通常较低,因为它使用数据的等级,而不是原始数字,因此基本上丢弃了一些信息。t

不稳健
检验是方差 的比较,但它对非正态性非常敏感,因此对近似正态性无效。换句话说,检验并不稳健。FF

“稳健的统计检验”没有正式的定义,但对于这意味着什么,有一种普遍的共识。维基百科网站对此有一个很好的定义(根据统计数据而不是测试本身):

稳健统计是对从广泛的概率分布中提取的数据具有良好性能的统计,尤其是对于非正态分布。

https://en.wikipedia.org/wiki/Robust_statistics