这是一个很好的例子来说明常客和贝叶斯推理方法之间的区别。
我的第一个简单的常客回答:
如果您已经假设罢工的分布是二项式的,那么您不需要了解其他 1000 名玩家的任何信息(也许您可以使用它们来检查您的二项式假设)。
一旦明确了二项式假设,您的估计就非常简单:3/10。这个估计的方差是通常的 p(1-p)/n = 0.021。
基本上,这 1000 名其他玩家是无关紧要的,除非你认为罢工分布有一些有趣且非二项式的东西(例如,人们玩的游戏越多越好)。
一种更深思熟虑的贝叶斯方法:
或者,如果您有兴趣应用您从其他玩家那里获得的先验知识,并且您认为新玩家基本上是来自同一人群的新样本,您应该在贝叶斯中考虑它条款。
估计玩家的先验分布。为此,您需要查看您的 1000 个数据点 - 已经观察到的 1000 名球员,您可以估计每个球员的罢工概率。这 1000 个点中的每一个只能取 21 个值中的一个(从 0 到 20 个打击,共 20 个),您将看到整个场地的分布。如果您将这些分数转换为比例(即介于 0 和 1 之间),则该分布可能可以通过具有Beta 分布的随机变量的概率分布相当好地近似. Beta 分布完全由两个参数来表征 - 比如说 a 和 b - 但是因为这些参数与您向我们询问的分布(特定玩家自己的罢工概率)并没有真正的关系,而是更高级别的分布,我们称它们为超参数。您可以通过与您的问题的重点无关的多种方式之一,从您的 1000 个数据点开发这些超参数的估计值。
在您完全了解球员的任何信息之前,您对他/她的得分比例(我们称之为 p)的最佳猜测将只是我们刚刚拟合的 Beta 分布中 p 的最可能值。
但是,我们有关于我们自己的玩家的数据,而不仅仅是普通人群! 在我们相信的上帝中,所有其他人都必须带来数据(如果我记得我在哪里找到它,我会注明这句话,对不起)。每次我们观察我们的玩家玩游戏并获得罢工,我们都有一条新的信息来精确我们对他的比例的估计。
贝塔分布作为一个比例的概率分布的一个巧妙之处在于,当我们从数据中收集新信息并创建一个新的、改进的比例估计时,概率论可以表明新的改进的估计也是贝塔分发 - 只是一个更集中的版本。这是因为在尝试对二项式模型进行估计时,Beta 分布是所谓的共轭先验。
也就是说,如果我们观察到 n 个成功事件中的 z 个(在这种情况下是有罢工的游戏);且先验分布为 beta(a,b);后验分布(在给定原始 1000 个数据点的情况下估计 p 的概率分布,并且是对十场比赛的新观察)是 beta(a+z, b+nz) 或(在我们的例子中)beta(a+3, b+7)。如您所见,获得的数据越多,a 和 b 的重要性就越低。这个数学相当简单,并且在许多文本中,但不是那么有趣(无论如何对我来说)。
如果你有 R,你可以通过运行下面的代码来查看一个例子(如果你没有 R,你应该得到它——它是免费的,它对于帮助思考这类问题非常棒)。这假设玩家的先验分布可以用 beta(2,5) 建模——这只是我编造的。实际上,您可以通过多种方式估算 a 和 b 的数字,而不是仅仅弥补 2 和 5,因为我认为曲线看起来不错。
如果您运行这个程式化的示例,您将看到,在给定 beta(2,5) 的先验分布的情况下,玩家得分的概率的点估计是 0.29 而不是 0.30。此外,我们可以创建一个可信区间,坦率地说,它比置信区间更直观、更容易解释(参见互联网上关于两者之间差异的许多问题和讨论,包括 CrossValidated)。
plot(0:100/100,dbeta(0:100/100,2,5), type="l", ylim=c(0,4), bty="l")
lines(0:100/100,dbeta(0:100/100,2+3,5+7), type="l", lty=2)
legend(0.6,3.5,c("Posterior distribution", "Prior distribution"),
lty=2:1, bty="n")
qbeta(c(0.025, 0.975), 2, 5) # credibility interval prior to any new data
qbeta(c(0.025, 0.975), 2+3, 5+7) # credibility interval posterior to data
qbeta(0.5, 2+3, 5+7) # point estimate of p, posterior to data
然后观察你的新玩家;并为新玩家计算新的后验分布。这实际上是说“鉴于我们刚刚观察到的情况,我们认为这个人最有可能在玩家分布的哪个位置?”