所以,让我们比较两个正态分布
Do this x times:
runs <- 100000
a.samples <- rnorm(runs, mean = 5)
b.samples <- rbeta(runs, mean = 0)
mc.p.value <- sum(a.samples > b.samples)/runs
低于我们的 alpha (0.05) 的 mc.p.values 除以 x 将给出 type1 错误率。我们的 H0 是 a.samples >= b.samples。(灵感来自https://www.countbayesie.com/blog/2015/3/3/6-amazing-trick-with-monte-carlo-simulations)
但是,我认为蒙特卡罗模拟必须遵循以下步骤:
算法:
- 为数据设置一些分布,f() 或 f(θ),以及一些 H0
- 多次重复以下两个步骤: (a) 根据 H0 模拟一个数据集 (b) 使用模拟数据计算 T(x)
- 添加从样本数据评估的 T(X)
- 订购所有的 T(x)s
- p 值是 T(x) 与样本数据中的值相比极端或更极端的比例
因此,第一个代码片段不是真正的蒙特卡罗模拟吗?并且 p 值是否有效,因为如果您将其绘制成图表,您不会得到预期的 5% type1 错误率,这是人们可能期望的统计测试。