二项式-二项式是二项式吗?

机器算法验证 可能性 分布 二项分布
2022-03-24 00:23:41

,让我看到它写道:XYBinomial(Y,p)YBinomial(n,q)

声明:是轻微的XBinomial(n,pq)

有一个简单的理由:首先,个成员,然后以概率选择每个成员,从而最终以概率随机选择每个成员。那是令人满意的。Yqppq

但是,如果上述声明为真的边际方差的计算与应该为真的答案不一致。如果上述声明成立,我们应该有但是,我得到XvarX=npq(1pq)

varX=E[var(XY)]+var(E[XY])=E[Yp(1p)]+var(pY)=np(1p)+p2nq(1q).

这不等于要看到这一点,请插入,在这种情况下npq(1pq)p=0.5,q=0.5npq(1pq)=0.1875nnp(1p)+p2nq(1q)=0.3125n

我想知道是否有人可以检查我的数学,或者指向任何显示真的是勉强 Bin(n,pq) 的资源。谢谢。X

3个回答

正如本指出的那样,你犯了一个代数错误,结果是正确的。这个过程称为二项式细化,如果您搜索该表达式,您会在已发表的文献中找到许多提及它的内容。该过程不仅适用于二项式随机变量,还适用于多项式、泊松和负二项式。假设我们有二项式、泊松或负二项式随机变量:

  • Y1Binomial(n,q)
  • Y2Poisson(λ)
  • Y3Negative Binomial(μ,ϕ),即,均值μ和方差μ+ϕμ2

我们可以将这些随机变量中的每一个视为来自随机过程的计数事件。现在假设各个事件并非全部被观察到,而是被随机截取,因此平均而言p其中一些人通过并被观察到,而其他人则迷路了。换句话说,我们通过保留每个原始事件的概率来“稀释”随机过程p

  • X1|Y1Binomial(Y1,p)
  • X2|Y2Binomial(Y2,p)
  • X3|Y3Binomial(Y3,p)

产生的“细化”分布具有以下边际分布:

  • X1Binomial(n,pq)
  • X2Poisson(pλ)
  • X3Negative Binomial(pμ,ϕ)

效果是按因子缩小分布的期望值p在不改变分配形式的情况下。

我自己使用的二项式细化示例是thinCountsedgeR 包 ( https://rdrr.io/bioc/edgeR/man/thinCounts.html ) 的功能,可用于生成 RNA-seq 读取计数以减少测序深度.

你的工作中有一个代数错误——因为E(Y)=nq你应该有:

V(X)=E(V(XY))+V(E(XY))=E(Yp(1p))+V(pY)=p(1p)E(Y)+p2V(Y)=nqp(1p)+p2nq(1q)=npq[(1p)+p(1q)]=npq(1pq),

匹配分布的边际方差Bin(n,pq).

其中然后具有指定的联合分布(是显而易见的,并且以为条件,我们将得到的总和),但显然Y=iBiX=iAiBiAiBernoulli(p)BiBernoulli(q)YXYYYBiAiBiBernoulli(pq)独立。因此XBinomial(n,pq)勉强。