正如问题所述 - 是否有可能证明零假设?根据我对假设的(有限)理解,答案是否定的,但我无法对此做出严格的解释。这个问题有确定的答案吗?
是否可以证明零假设?
如果您谈论的是现实世界而不是形式逻辑,那么答案当然是。通过经验手段对任何事物的“证明”取决于一个人可以做出的推论的强度,而这反过来又取决于根据人们对世界如何运作的一切(即理论)所了解的一切所评估的测试过程的有效性。每当一个人接受某些经验结果证明拒绝“零”假设是正当的,就必然会做出这种判断(设计的有效性;世界以某种方式运作),因此必须做出必要的类似假设来证明推断“对null" 完全没有问题。
那么类似的假设是什么?这是健康科学和社会科学中常见的“证明无效”的示例。(1) 以某种具有实际意义的方式定义“无效”或“无效”。假设我相信我应该表现得好像在 t1 和 t2 两种治疗之间对一种疾病没有有意义的差异,除非一种治疗比另一种治疗的恢复机会高 3%。(2) 找出一个有效的设计来测试是否有任何影响——在这种情况下,t1 和 t2 之间的恢复可能性是否存在差异。(3) 进行功效分析以确定是否需要多大的样本量才能产生足够高的似然性——在给定的情况下,我有信心依赖它假设它存在。通常人们会说,如果在指定的 alpha 下观察到指定效果的可能性至少为 0.80,那么功效就足够了,但正确的置信水平实际上是您对错误的厌恶程度——就像您选择 p 时一样“拒绝零”的-value阈值。(4)进行经验测试并观察效果。如果它低于指定的“有意义的差异”值——在我的例子中是 3%——你已经“证明”了“没有效果”。
有关此问题的良好处理,请参阅 Streiner,DL Unicorns Do Exist: A Tutorial on “Proving” the Null Hypothesis。加拿大精神病学杂志 48, 756-761 (2003)。
从数学方面回答:当且仅当“假设互为奇异”时才有可能。
如果通过“证明”你的意思是有一个可以“接受”的规则(我应该说:)) 犯错误的概率为零,那么您正在搜索可以称为“理想测试”的东西,并且存在:
如果您正在测试随机变量取自或从(即测试相对) 那么存在一个理想检验当且仅当 (和是“互单数”)。
如果您不知道“互单数”是什么意思,我可以举个例子:和(制服上和) 互为单数。这意味着如果你想测试
相对
那么存在一个理想的测试(猜猜它是什么:)):一个永远不会出错的测试!
如果和不是相互单数的,那么这不存在(这是由“仅当部分”引起的)!
在非数学术语中,这意味着当且仅当证明已经在您的假设中时(即当且仅当您选择了假设)时,您才能证明 null和如此不同,以至于一个单一的观察不能被识别为来自反之亦然)。
是的,有一个确定的答案。答案是:不,没有办法证明零假设。据我所知,你能做的最好的事情就是围绕你的估计抛出置信区间,并证明影响是如此之小以至于它可能基本上不存在。
对我来说,决策理论框架提供了理解“零假设”的最简单方法。它基本上说必须至少有两种选择:零假设和至少一种选择。那么“决策问题”就是接受其中一个备选方案,并拒绝其他备选方案(尽管我们需要准确理解“接受”和“拒绝”假设的含义)。我看到“我们可以证明零假设吗?”的问题。类似于“我们总能做出正确的决定吗?”。从决策理论的角度来看,答案显然是肯定的,如果
1)决策过程中没有不确定性,因为这样才能确定正确的决策是一个数学练习。
2)我们接受问题的所有其他前提/假设。最关键的一个(我认为)是我们正在决定的假设是详尽的,其中一个(并且只有一个)必须是正确的,而其他的必须是错误的。
从更哲学的角度来看,不可能“证明”任何东西,因为“证明”完全取决于导致该“证明”的假设/公理。我认为证明是一种逻辑等价,而不是“事实”或“真理”,因为如果证明是错误的,导致它的假设也是错误的。
将此应用于“证明零假设”,我可以通过简单地假设它是真的,或者假设它在满足某些条件(例如统计量的值)时为真来“证明”它是真的。