在所有可以模拟二元选举的“合理”分布中,二项分布是否具有最小的方差?

机器算法验证 数理统计 方差 二项分布 分散不足
2022-03-07 08:23:06

想象一场选举,其中个人做出二元选择:他们投票支持或反对 A。结果是人投票给 A,因此 A 的结果是nmp=m/n

如果我想对这些选举进行建模,我可以假设每个人以概率独立投票给 A ,从而导致选票的二项式分布:该分布具有均值和方差p

votes for ABinom(n,p).
m=npnp(1p)

我也可以做出其他假设。例如,我可以假设概率本身是来自某个分布(例如 beta)的随机变量;这可能导致 A 的选票出现 beta 二项式分布。或者我可以假设人们以 k 为一组进行投票其中每组人做出相同的选择,并且 A 的概率为这将导致方差较大的二项分布。在所有这些情况下,所得分布的方差都大于最简单的二项式方案。pkkp

我可以声称二项式分布的方差最小吗?换句话说,这种说法能否以某种方式变得精确,例如通过在可能的分布上指定一些合理的条件?这些条件会是什么?

还是可能存在一些方差较低的合理分布?

可以想象更低的方差,例如,当所有人事先就他们将如何投票达成一致时,因此并不是真正的随机变量,而是一个固定数字那么方差为零。或者也许几乎所有人都同意,但少数人不同意,然后一个人可能在附近有微小的差异。但这感觉像是在作弊。在没有任何预先安排的情况下,即当每个人在某种意义上随机投票时,是否可以有小于二项式的方差?nvotes for Amm

2个回答

没有

假设选民由已婚对组成。丈夫们聚在一起决定投票反对他们自己随机选择的妻子。结果始终是每个候选人的n=2kk

你可能会大喊犯规,因为丈夫们没有随机投票。嗯,他们是——他们只是碰巧与他们妻子的随机投票密切相关。如果这让您感到困扰,请让每个丈夫掷十个公平的硬币来稍微改变一下。如果十个都是头,他会和他的妻子一起投票;否则他会投票反对她。您可以检查选举结果是否仍然具有较小的(尽管非零)方差,即使每次投票都是不可预测的。

问题的症结在于男性和女性两个投票集团之间的负协方差。

双否(它使方差最大化)

whuber的回答非常好(除了他做出了非常不切实际的建模假设,将这种顽固的行为归因于错误的性别!)。为了补充这个答案,如果您假设投票是独立的,那么还值得研究一下会发生什么。如果我们将选票视为相互独立的概率为则均值和方差为:p1,...,pn

E(Sn)=i=1npiV(Sn)=i=1npii=1npi2.

如果我们以固定期望值为条件,则可以证明时达到最大方差(为了证明这一点,您可以设置拉格朗日优化来获得此解决方案。)因此,二项式分布不仅不会最小化方差,它还会在我们拥有独立投票的所有可能情况下最大化方差。μ=E(Sn)p1==pn=μ