如何使用超几何测试

机器算法验证 超几何分布
2022-03-24 01:59:18

我的教授很快在黑板上写了一些东西,我很难解释正在提出的论点。我正在尝试测试这个结论。我读了这篇文章,但我仍然没有完全掌握它。如果我可以通过一些可靠的指导指出正确的方向,那将非常有帮助。主要是我的问题如下

  1. 为什么/什么时候会使用超几何测试?
  2. 在这里确定零假设是否显而易见?
  3. 这里提出的论点究竟是什么?

在此处输入图像描述

1个回答

你可以看看维基百科

超几何检验使用超几何分布来测量从包含成功的大小的总体中抽取包含特定k成功次数(在n总抽取中)的样本的统计显着性在样本中过度表示成功的测试中,超几何 p 值计算为从总体中随机抽取或更多成功的概率在代表性不足的测试中,p 值是随机抽取或较少成功的概率。NKknk

这里的零假设是u, 即基因受辐射的概率等于p, 基因不受辐射的概率。虽然我认为这里也必须考虑不确定性,但这里通过直接从样本p估计来采取捷径,因为pAA+B. 这可能是等效的。

公式是原假设下的概率(其中p=AA+B) 你会看到C或更多带有该基因的细菌C+D样品。所以这就是p-价值。

这就是答案。既然你在想p-values,也许您可​​以阅读Andrew Gelman的几篇博文,我认为对这个假设框架持怀疑态度是个好主意。