抽样分布是否合法进行推理?

机器算法验证 分布 推理 常客
2022-01-22 09:16:45

一些贝叶斯主义者攻击频率论推断,称“没有唯一的抽样分布”,因为它取决于研究人员的意图(Kruschke、Aguinis 和 Joo,2012,第 733 页)。

例如,假设一名研究人员开始收集数据,但在 40 名参与者之后,他的资金意外中断。在这里如何定义抽样分布(以及后续的 CI 和 p 值)?我们是否只是假设每个组成样本都有 N = 40?或者它是否由具有不同 N 的样本组成,每个样本的大小由他的资金可能被削减的其他随机时间决定?

教科书中的 t、F、卡方(等)、零分布都假设 N 对于所有组成样本都是固定且恒定的,但在实践中可能并非如此。对于每个不同的停止程序(例如,在某个时间间隔之后或直到我的助手累了),似乎都有不同的采样分布,并且使用这些“经过验证且真实的”固定 N 分布是不合适的。

这种批评对常客 CI 和 p 值的合法性有多大破坏性?有理论上的反驳吗?似乎通过攻击抽样分布的概念,频率论推理的整个大厦是脆弱的。

非常感谢任何学术参考。

2个回答

通常,您会根据实际样本量进行推断n,因为它是感兴趣的参数的辅助;即它不包含有关其真实值的信息,只会影响您可以测量它们的精度。Cox (1958),“与统计推断相关的一些问题”,Ann。数学。统计学家。 29 , 2通常被引用为首先解释有时被称为条件性原则的东西,尽管它在更早的工作中是隐含的,让人回想起费舍尔的“相关子集”的想法。

如果您的研究人员的资金因迄今为止的结果令人失望而被切断,那么当然n不是辅助的。也许最简单的问题说明是从二项式(固定试验次数)或负二项式(固定次数)抽样方案估计伯努利概率。两者的充分统计量相同,但分布不同。你将如何分析一个你不知道遵循哪个实验的实验?Berger & Wolpert (1988),似然原则讨论了这个和其他停止规则对推理的影响。

您可能想考虑如果不考虑任何抽样分布会发生什么。Armitage (1961), “Comment on 'Consistency in Statistical Inference and Decision' by Smith”, JRSS B, 23 ,1指出,如果你抽样X从正态分布直到nX¯ķ, 检验均值的似然比μ=0对比μ0大号(0)大号(X¯)e-ķ2/2,所以研究人员可以通过适当的选择提前设置绑定ķ. 只有频繁分析才能考虑在这种看似不公平的抽样方案下的似然比分布。参见Kerridge (1963) 的回应,“误导性贝叶斯推论的频率界限”,Ann。数学。统计。, 34 , Cornfield (1966), “顺序试验、顺序分析和似然原理”, The American Statistician , 20 , 2 , & Kadane (1996), “推理已成定局”, JASA , 91 , 435

指出频率论推理对研究人员意图的依赖是对那些对贝叶斯推理的“主观性”大发雷霆的人(如果还有的话)进行方便的挖掘。就个人而言,我可以忍受它;一个程序在一系列重复中的​​执行总是或多或少是概念性的,这并没有减损它是一个值得考虑的有用的东西(“可能性的校准”是 Cox 描述 p 值的方式)。从参考文献的日期开始,您可能已经注意到这些问题并不是很新;通过先验论证来解决它们的尝试在很大程度上已经消失(除了在互联网上,除了在琐碎的事情上总是落后于时代)&

PS:想为 Berger & Wolpert 添加一个平衡点,我偶然发现了Cox & Mayo (2010),“Objectivity and Conditionality inFrequentist Inference” in Error and Inference在我断言辩论已经平息时,很可能存在一厢情愿的想法,但令人惊讶的是,在半个世纪左右之后,关于这个问题几乎没有什么新的说法。(尽管如此,这是对常客思想的简洁而雄辩的辩护。)

对您的问题的简短回答是:这取决于您问谁;-) 顽固的贝叶斯主义者将宣布战胜或至少与常客方法论相提并论。顽固的常客将默认为“无法回答”。其他 99% 的统计学家将使用任何已被证明在不间断实验下可靠的方法。

我知道抽样分布对研究人员意图的敏感性可能会令人不安,而且这个问题确实没有好的解决方案。贝叶斯主义者和频率论者都必须使用一些主观性和判断力来决定如何形成推理。但是,我认为您从一个普遍存在争议的领域举了一个例子,并将问题完全归咎于频率论推理。连续和/或停止的实验是推理的主观性质的经典例子......并且没有绝对客观和商定的答案。

常规推理呢,你实际在哪里收集你想要得到的样本?在这里,我认为频率论者占上风,因为 CI 和 p 值在它们的重复采样特性方面得到了很好的校准,而贝叶斯推理保留了其个人和主观性质。

如果您想对贝叶斯响应进行更理论的阐述,我会阅读有关“条件推理”的内容,主要研究人员是Nancy Reid和 Lehmann。