Z 值和 p 值有什么区别?

机器算法验证 假设检验 p 值 z 统计量
2022-02-27 23:55:59

在网络主题算法中,为统计返回p 值Z 分数似乎很常见:“输入网络包含子图 G 的 X 个副本”。如果满足,则子图被视为主题

  • p 值 < A,
  • Z 分数 > B 和
  • X > C,对于某些用户定义(或社区定义)的 A、B 和 C。

这引发了这个问题:

问题:p-value 和 Z-score 有什么区别?

和子问题:

问题:是否存在相同统计量的 p 值和 Z 值可能提出相反假设的情况?上面列出的第一个和第二个条件是否基本相同?

3个回答

根据您的问题,我想说这三个测试之间没有区别。从某种意义上说,您始终可以选择 A、B 和 C,这样无论您使用什么标准,都会得出相同的决定。尽管您需要使 p 值基于相同的统计数据(即 Z 分数)

要使用 Z 分数,假设均值μ和方差σ2都是已知的,并且分布假设为正态(或渐近/近似正态)。假设 p 值标准是通常的 5%。然后我们有:

p=Pr(Z>z)<0.05Z>1.645Xμσ>1.645X>μ+1.645σ

所以我们有三元组,它们都代表相同的截止值。(0.05,1.645,μ+1.645σ)

请注意,相同的对应关系将适用于 t 检验,尽管数字会有所不同。两个尾巴测试也将有类似的对应关系,但数字不同。

分数以标准差为单位描述您与平均值的偏差。您是否接受或拒绝您的零假设并不明确。Z

值是在零假设下我们可以观察到与您的统计数据一样极端的点的概率的情况下您是拒绝还是接受您的零假设pα

考虑一个例子,其中和原假设是然后你观察你的方面偏离你的原假设有多远)并且你的 -value 是 5.733e-7。对于 95% 的置信度,您将有一个测试大小,并且由于那么您拒绝原假设。但是对于任何给定的统计数据,应该有一些等效使得测试是相同的。XN(μ,1)μ=0x1=5Zσpα=0.05p<αAB

p值表示统计数据的可能性有多大。 -score 表示距离平均值有多远。它们之间可能存在差异,具体取决于样本量。z

对于大样本,即使是与平均值的微小偏差也不太可能。即,值也可能非常小相反,对于小样本,甚至大的偏差也不是不可能的。即较大的分数不一定意味着较小的值。pzzp