Scheffé 置信区间的目的

机器算法验证 假设检验 多重比较
2022-04-18 17:45:39

Scheffé 的方法最初由 Henry Scheffé 撰写时,被描述为用于识别多重比较的 ANOVA 问题中的统计显着对比。

但是在这个论坛上,我在这个问题下的答案和评论中被告知,甚至不应该这样做:

“只有在您看到数据之前指定了对比时,对比测试才会在空值下具有正确的分布。”

如前所述,这当然是无稽之谈。这取决于使用什么测试。如果您使用 at 仅用于测试特定对比度是否与零显着不同的测试,并且您发现存在一些显着的对比度,那么您就犯了一个错误。但这就是我认为 Scheffé 的方法旨在解决的问题。

并在评论中:

“而且一般来说,仅仅根据数据中的模式来考虑测试数据中的模式是不明智的。”

如果不完全是这样,Scheffé 的方法是什么?在我看来,有些人被告知,如果使用相同的测试,那么测试数据建议的对比是无效的,如果事先确定了特定的对比(这显然是正确的)并从那里跳到结论是没有正确的方法来测试数据所建议的对比。

“天真的方法是不正确的;因此没有一种方法是正确的。” ----我的解释

那些想要为我所解释的观点辩护的人能否解释他们认为 Scheffé 方法的目的是什么?

2个回答

这是用于选择性推理的同时推理的经典案例(参见 [1])。我会解释。

“选择性(边际)推断”是指您想要对数据驱动的参数子集进行推断。在方差分析的情况下,子集将是几个对比。“同时推断”是指您想要对特定的参数向量进行推断。自然地,同时需要选择性,因为向量的联合真实性需要其每个(选定的)元素的真实性。

Sheffe 对这个问题的看法如下:由于他事先不知道研究人员将研究的对比,他将同时控制所有可能的对比。在这种情况下,无论研究人员选择何种对比,无论是否由数据驱动,他都已经在控制它。

结论:如果使用 Scheffe 的方法进行推理或 CI,则对选定的参数进行推理是没有问题的。问题在于,对于特定的参数/对比度,它过于保守(即低功率)。

[1] Cox, DR 1965。“关于多重比较方法的评论”。技术计量学 7 (2): 223–224。doi:10.1080/00401706.1965.10490250。

“只有在您看到数据之前指定了可能测试的对比集时,对比测试才会在空值下具有正确的分布。” 本来是一个更好的方式。然后,Scheffé 的方法指定了预定义组的方法之间所有可能的对比,我怀疑是否还有任何分歧。

我认为这里的重点是,您似乎提议将特定数据建议的新的基于对比的测试应用于该数据本身;在这种情况下,实验错误率并没有真正得到控制,因为你可能发明的测试集没有很好地定义,即使一旦你定义了测试集,对比集也是如此。