如何比较观察到的和预期的事件?

机器算法验证 r 统计学意义 卡方检验
2022-03-22 04:30:26

假设我有 4 个可能事件的频率样本:

Event1 - 5
E2 - 1
E3 - 0
E4 - 12

我有我的事件发生的预期概率:

p1 - 0.2
p2 - 0.1
p3 - 0.1
p4 - 0.6

用我的四个事件(18)观察到的频率之和,我可以计算出事件的预期频率,对吗?

expectedE1 - 18 * 0.2 = 3.6
expectedE2 - 18 * 0.1 = 1.8
expectedE1 - 18 * 0.1 = 1.8
expectedE1 - 18 * 0.6 = 10.8

如何比较观察值与预期值?测试我计算出的概率是否是好的预测指标?

我想到了卡方检验,但结果会随着样本量(n = 18)而变化,我的意思是,如果我将观察值乘以 1342 并使用相同的方法,结果会有所不同。也许 wilcox 配对测试有效,但你有什么建议?

如果可以在R中提出建议,那就更好了。

1个回答

您提到如果将所有值乘以会得到不同的结果。这不是问题。应该得到非常不同的结果。如果你掷硬币,它出现正面,这并不能说明太多。如果你掷硬币次并且每次都得到正面,那么你有更多的信息表明这枚硬币是不公平的。13421342

通常,当您的大部分类别(例如,至少 )的预期出现次数如此之低(例如,低于 )时,您希望使用测试的替代方法。一种可能性是Fisher 精确检验,它在 R 中实现您可以将检验视为 Fisher 精确检验的近似值,并且该近似值仅在更多预期计数较大时才有效。χ2520%χ2