我搜索了有关参数和非参数测试区别的问题,似乎这些问题都集中在一个非常具体的测试、数据问题或一些技术区别上。我对测试假设的问题(不要;改为检查)或功率或错误率问题不感兴趣。
我的问题是关于两种测试的解释。参数化和非参数化测试结果的解释方式有区别吗?如果您正在运行非参数测试,那么您正在削弱(消除)讨论未知人群的路径,因此您似乎在如何讨论测试结果方面受到更多限制。如果您进行参数测试,您与总体的联系取决于假设。每个测试的正确解释是什么?这些区别是否重要?
我搜索了有关参数和非参数测试区别的问题,似乎这些问题都集中在一个非常具体的测试、数据问题或一些技术区别上。我对测试假设的问题(不要;改为检查)或功率或错误率问题不感兴趣。
我的问题是关于两种测试的解释。参数化和非参数化测试结果的解释方式有区别吗?如果您正在运行非参数测试,那么您正在削弱(消除)讨论未知人群的路径,因此您似乎在如何讨论测试结果方面受到更多限制。如果您进行参数测试,您与总体的联系取决于假设。每个测试的正确解释是什么?这些区别是否重要?
这是一个很好的机会来讨论和阐明统计模型的含义以及我们应该如何思考它们。让我们从定义开始,这样答案的范围是毫无疑问的,然后从那里继续。为了使这篇文章简短,我将限制示例并放弃所有插图,相信读者能够根据经验提供它们。
看起来可以将“测试”从广义上理解为任何类型的统计过程:不仅是零假设检验,还包括频率论或贝叶斯框架中的估计、预测和决策。这是因为“参数”和“非参数”之间的区别与程序类型之间的区别或这些框架之间的区别是分开的。
无论如何,使程序具有统计意义的原因在于,它使用特征尚未完全了解的概率分布对世界进行建模。相当抽象地,我们认为数据的值进行数字编码而产生的;我们使用的特定数据对应于特定的;并且有一个概率定律以某种方式确定了我们实际拥有
假设该概率定律属于某个集合。在参数设置中,元素对应于参数的有限集合。 在非参数设置中,没有这样的对应关系。这通常是因为我们不愿意对做出强有力的假设。
做一个很少讨论的进一步区分似乎很有用。 在某些情况下,肯定是数据的完全准确模型。让我举个例子,而不是定义我所说的“完全准确”的含义。对有限的、定义明确的总体进行调查,其中观察结果是二元的,不会遗漏任何数据,也不会出现测量误差。例如,一个例子可能是对从装配线上下来的随机样本进行破坏性测试。我们对这种情况的控制——了解总体并能够真正随机选择样本——确保了二项式模型对结果计数的正确性。
在许多——也许是大多数——其他情况下,并不“完全准确”。例如,许多分析假设(隐含或明确)是正态分布。这在物理上总是不可能的,因为任何实际测量都受到其可能范围的物理限制,而正态分布则没有这样的限制。我们一开始就知道正常假设是错误的!
不完全准确的模型在多大程度上是个问题?想想优秀的物理学家做了什么。当物理学家使用牛顿力学解决问题时,是因为她知道在这个特定的尺度上——这些质量、这些距离、这些速度——牛顿力学已经足够精确到可以工作了。她将选择仅在问题需要时考虑量子或相对论效应(或两者)来使她的分析复杂化。她熟悉的定理定量地表明牛顿力学是量子力学和狭义相对论的极限情况。这些定理帮助她理解选择哪种理论。这种选择通常没有记录,甚至没有辩护;它甚至可能在不知不觉中发生:选择是显而易见的。
一个好的统计学家总是有类似的考虑。例如,当她选择一个其理由依赖于正态假设的程序时,她正在权衡实际可能偏离正态行为的程度以及这会如何影响该程序。在许多情况下,可能的影响非常小,甚至不需要量化:她“假设正常”。在其他情况下,可能的影响是未知的。在这种情况下,她将进行诊断测试,以评估偏离常态及其对结果的影响。
它开始听起来像不完全准确的设置与非参数设置几乎没有区别:假设一个参数模型和评估现实如何偏离它,一方面,假设一个非参数模型之间真的有任何区别吗?另一方面? 在内心深处,两者都是非参数的。
根据这个讨论,让我们重新考虑参数和非参数过程之间的传统区别。
“非参数程序是稳健的。” 所以,在某种程度上,必须是所有程序。问题不在于稳健性与非稳健性,而是任何程序的稳健性。中的分布有多少以及以何种方式偏离?作为这些偏离的函数,测试结果会受到多大影响?这些是适用于任何设置的基本问题,无论是否参数化。
“非参数程序不需要拟合优度检验或分布检验。” 这通常不是真的。实际上是任何分布的意义上,“非参数”经常被错误地描述为“无分布” ,但几乎从来没有这种情况。几乎所有非参数程序都做出限制的假设。例如,可能被分成两组进行比较,一个分布管理一组,另一个分布管理另一个。也许根本没有关于的假设,但是. 这就是集中趋势的许多比较所假设的。关键是在做出了明确的假设,并且应该像任何参数假设一样对其进行检查。
“非参数程序不做假设。” 我们已经看到他们这样做了。与参数程序相比,它们只倾向于做出限制较少的假设。
过度关注参数与非参数可能会适得其反。 它忽略了统计程序的主要目标,即增进理解、做出正确的决定或采取适当的行动。 统计程序的选择基于它们在问题环境中的预期执行情况,考虑到有关问题的所有其他信息和假设,以及结果对所有利益相关者的后果。
因此,“这些区别是否重要”的答案似乎是“不重要”。