做Pr (第一类错误)Pr(Type I error)永远不等于αα与连续数据?

机器算法验证 假设检验 统计学意义
2022-04-01 07:32:37

这个问题:比较和对比、p 值、显着性水平和 I 型错误引用了使用离散数据时出现的异常。连续数据还有其他例外吗?

2个回答

在真实的、非模拟的数据中,真正的 P(I 型错误)是否真的等于α

假设不成立(所有假设什么时候成立?),人们在看到数据后选择假设,在检查假设后选择程序,忽略异常值等。

即使是“精确的”非参数程序也依赖于很少完全成立的假设(例如独立性或可交换性)。

将 p 值视为——在完美的条件下——有时相当准确(其余时间可能是信息丰富的虚构),你可能不会错得太远。

我能想到的唯一例子是数据挖掘例如,如果运行许多测试(但未纠正)并且只报告那些“显着”的测试,则 I 类错误的概率远高于 alpha。明显的例子是通过许多检验进行多重比较,而没有像 Bonferroni 校正或逐步变量选择之类的东西。 t