为什么要使用“随机”置信区间或可信区间?

机器算法验证 置信区间 可信区间
2022-01-27 05:55:24

我最近正在阅读一篇论文,该论文在其置信度和可信区间中加入了随机性,我想知道这是否是标准的(如果是,为什么这是合理的做法)。要设置符号,假设我们的数据是并且我们有兴趣为参数创建区间。我习惯于通过构建函数来构建置信度/可信度区间:xXθΘ

fx:Θ{0,1}

并让我们的区间为I={θΘ:fx(θ)=1}

这是随机的,因为它取决于数据,但取决于数据,它只是一个间隔。本文改为定义

gx:Θ[0,1]

以及的集合。它将关联的区间定义为请注意,这在很大程度上取决于辅助随机性,而不是来自数据的任何内容。{Uθ}θΘ[0,1]I={θΘ:fx(θ)Uθ}

我很好奇为什么有人会这样做。我认为“放宽”从等函数到等函数的区间概念是有道理的;这是某种加权置信区间。我不知道它有任何引用(并且希望得到任何指示),但这似乎很自然。但是,我想不出任何理由添加辅助随机性。fxgx

任何指向文献/理由的指针将不胜感激!

2个回答

有时在理论上使用随机程序,因为它简化了理论。在典型的统计问题中,它在实践中是没有意义的,而在博弈论设置中它是有意义的。

我可以看到在实践中使用它的唯一原因是它是否以某种方式简化了计算。

从理论上讲,根据充分性原则,人们可以争辩说不应该使用它:统计结论应该只基于数据的充分总结,并且随机化引入了无关的随机 的依赖性,这不是数据充分总结的一部分。U

UPDATE  

为了回答 whuber 在下面的评论,这里引用:“为什么随机程序“在实践中没有意义”?正如其他人所指出的,实验者非常愿意在他们的实验数据的构建中使用随机化,例如随机分配治疗和控制,那么在随后的数据分析中使用随机化有什么不同(不切实际或令人反感)?”

好吧,为了获得数据而对实验进行随机化是有目的的,主要是为了打破因果链。如果以及何时有效是另一个讨论。在分析中使用随机化的目的是什么?我见过的唯一原因是它使数学理论更完整!没关系,只要它继续。在博弈论的背景下,当有一个真正的对手时,随机化我的帮助来迷惑他。在实际的决策环境中(卖还是不卖?)必须做出决定,如果数据中没有证据,也许可以扔硬币。但在科学背景下,问题在于我们能学到什么从数据来看,随机化似乎格格不入。我看不出它有什么真正的优势!如果您不同意,您是否有可以说服生物学家或化学家的论点?(在这里,我不认为模拟是引导程序或 MCMC 的一部分。)

这个想法是指测试,但鉴于测试和置信区间的双重性,同样的逻辑也适用于 CI。

基本上,随机测试确保也可以为离散值实验获得给定大小的测试。

假设您想在测试硬币的公平性(在此处插入您选择的任何可以用二项式实验建模的示例)也就是说,您针对(例如) 0.5 。假设您已掷硬币次。α=0.05pH0:p=0.5H1:p<0.5n=10

显然,很少有的证据。对于成功,我们可以通过 R 计算测试的,得到 0.054。对于,我们得到 0.0107。因此,如果没有随机化,就无法以 5% 的概率拒绝真正的H0k=2ppbinom(2,10,.5)k=1H0

如果我们在观察时随机化拒绝和接受,我们仍然可以实现这个目标。k=2