有没有参数和非参数的统计检验?这个问题是由面试小组提出的。这是有效的问题吗?
有没有参数和非参数的统计检验?
从根本上讲,很难准确说出“参数检验”和“非参数检验”的含义,尽管有许多具体的例子,大多数人都会就检验是参数还是非参数达成一致(但绝不会两者兼而有之) . 快速搜索给出了这张表,我想它代表了参数和非参数测试之间某些领域的常见实际区别。
刚才提到的表格上面有一句话:
“......参数数据具有潜在的正态分布......其他任何东西都是非参数的。”
在某些领域,我们假设正态性并使用 ANOVA,这是参数化的,或者我们不假设正态性并使用非参数替代方案,这可能是一个公认的标准。
这可能不是一个很好的定义,在我看来也不是很正确,但它可能是一个实用的经验法则。主要是因为社会科学的最终目标是分析数据,能够基于非正态分布制定参数模型然后无法分析数据有什么好处?
另一种定义是将“非参数测试”定义为不依赖于分布假设和参数测试的测试。
呈现的前者和后者定义定义了一类测试,然后将另一类定义为补充(任何其他)。根据定义,这排除了测试可以是参数的也可以是非参数的。
事实是,后一个定义也是有问题的。如果可以强加某些自然的“非参数”假设,例如对称性,该怎么办?这会将原本不依赖于任何分布假设的检验统计量转变为参数检验吗?大多数人会说不!
因此,在非参数测试类中有一些测试可以做出一些分布假设只要它们不是“太参数化”。“参数”和“非参数”测试之间的界限已经变得模糊,但我相信大多数人会坚持测试是参数还是非参数,也许两者都不是,只能说两者都是没有什么意义。
从不同的角度来看,许多参数检验是(等同于)似然比检验。这使得一个通用的理论成为可能,并且我们对在合适的规律性条件下似然比检验的分布特性有了统一的认识。相反,非参数检验本身 没有可能性并且如果没有基于可能性的统一方法,我们必须逐案得出分布结果。经验似然理论然而,主要由斯坦福大学的 Art Owen 开发是一个非常有趣的折衷方案。它提供了一种基于可能性的统计方法(对我来说很重要,因为我认为可能性比值更重要),而不需要典型的参数分布假设。基本思想是在经验数据上巧妙地使用多项式分布,这些方法非常“参数化”,但在不限制参数假设的情况下有效。
恕我直言,基于经验可能性的测试具有参数测试的优点和非参数测试的普遍性,因此在我能想到的测试中,它们最接近参数和非参数的资格,尽管我会不要使用这个术语。
参数用于(至少)两个含义:A - 声明您正在假设噪声分布的系列与其参数。B - 声明您假设解释变量和结果之间的特定函数关系。
一些例子:
- 具有线性链接的分位数回归将有资格作为 B 参数和 A 非参数。
- 具有高斯噪声的时间序列的样条平滑可以质量为 A 非参数和 B 参数。
术语“半参数”通常指的是案例 B,意味着您没有假设整个函数关系,而是您有更温和的假设,例如“在预测变量的某些平滑转换中加法”。
您还可以对噪声的分布进行更温和的假设 - 例如“所有矩都是有限的”,而无需具体指定分布的形状。据我所知,这种假设没有术语。
请注意,答案与数据生成过程背后的基本假设有关。当说“a-parametric test”时,通常指的是A意义上的非参数。这就是你的意思,那么我会回答“no”。不可能同时在同一意义上是参数化和非参数化。
我想这取决于他们所说的“参数和非参数”是什么意思?同时是两者兼而有之,还是两者兼而有之?
许多人认为 Cox 比例风险模型是半参数的,因为它没有参数化地估计基线风险。
或者,您可能会选择将许多非参数统计信息视为实际上是大规模参数化的。
Bradley 在其经典的无分布统计检验(1968 年,第 15-16 页 - 请参阅此问题以获取报价)中阐明了无分布检验和非参数检验之间的区别,他说这两种检验经常相互混淆,并给出了一个作为中位数符号检验的无参数分布检验示例。该检验不对变量值抽样总体的潜在分布做出任何假设,因此它是无分布的。但是,如果选择的中位数是正确的,则应该以相等的概率选择高于和低于它的值,测试来自抽样变量是否高于或低于中值估计值应该是二项式的,,因此它同时是参数的。
更新
根据评论中的讨论(谢谢,whuber),似乎 Bradley 是少数,而 Bradley 所谓的 distribution-free,大多数人称之为parametric。虽然没有什么可以同时是,但问题的答案可能完全取决于您如何定义该术语,无论您是区分 Bradley 还是将 Bradley 的两个元素都称为“参数”。