短语“假设检验”和“显着性检验”之间有区别还是相同?
在@Micheal Lew 的详细回答之后,我有一个困惑,即现在的假设(例如,测试均值的 t 检验)是“显着性检验”或“假设检验”的示例?还是两者兼而有之?你会如何用简单的例子来区分它们?
短语“假设检验”和“显着性检验”之间有区别还是相同?
在@Micheal Lew 的详细回答之后,我有一个困惑,即现在的假设(例如,测试均值的 t 检验)是“显着性检验”或“假设检验”的示例?还是两者兼而有之?你会如何用简单的例子来区分它们?
显着性检验是 Fisher 设计的,假设检验是 Neyman 和 Pearson 设计来替代显着性检验的。它们不相同,并且在一定程度上相互不兼容,这会让大多数零假设检验的用户感到惊讶。
Fisher 显着性检验产生的 ap 值表示在原假设下观察值的极端程度。该 p 值是反对零假设的证据指数,并且是显着性水平。
Neyman 和 Pearson 的假设检验设置了原假设和备择假设,并作为接受原假设的决策规则。简而言之(我可以在这里说的更多)你选择一个可接受的误报率,alpha(通常为 0.05),并根据 p 值是高于还是低于 alpha 接受或拒绝 null。如果您希望防止误报错误,您必须遵守统计测试的决定。
Fisher 的方法允许您在解释结果时考虑任何您喜欢的因素,例如在解释和呈现结果时可以非正式地考虑预先存在的证据。在 NP 方法中只能在实验设计阶段完成,而且似乎很少做。在我看来,Fisherian 方法在基础生物科学工作中比 NP 方法更有用。
关于显着性检验和假设检验之间的不一致以及两者的不幸杂交有大量文献。您可以从这篇论文开始:古德曼,迈向循证医学统计。1:P值谬误。 https://pubmed.ncbi.nlm.nih.gov/10383371/
在许多情况下,这两个语句的含义相同。但是,它们也可能完全不同。
检验假设包括首先说出您认为某种现象会发生什么,然后针对这种现象进行某种检验,然后确定该现象是否真的发生。在许多情况下,假设检验不需要涉及任何类型的统计检验。我想起了物理学家欧内斯特·卢瑟福的这句话——如果你的实验需要统计数据,你应该做一个更好的实验。 话虽如此,假设检验通常会使用某种统计工具。
相反,显着性检验是一个纯粹的统计概念。本质上,一个人有两个假设——零假设,它表明你的两个(或更多)数据集合之间没有区别。另一种假设是,您的两个样本之间存在差异并非偶然。
根据您的研究设计,然后您使用统计检验比较两个(或更多)样本,这会为您提供一个数字,然后您将其与参考分布(如正态分布、t 分布或 F 分布)进行比较,如果此检验统计量超过临界值,您拒绝原假设并得出两个(或更多)样本之间存在差异的结论。该标准通常是偶然发生差异的概率小于二十分之一(p<0.05),尽管有时使用其他标准。