机器算法验证 - 二项式-二项式是二项式吗？ - 吾爱随笔录

二项式-二项式是二项式吗？

机器算法验证可能性分布二项分布

2022-03-24 00:23:41

让，让。我看到它写道： $X\mid Y\thicksim\operatorname{Binomial}(Y,p)$ $Y\thicksim\operatorname{Binomial}(n,q)$

声明：是轻微的。 $X$ $\operatorname{Binomial}(n,pq)$

有一个简单的理由：首先，个成员，然后以概率选择每个成员，从而最终以概率随机选择每个成员。那是令人满意的。 $Y$ $q$ $p$ $pq$

但是，如果上述声明为真的边际方差的计算与应该为真的答案不一致。如果上述声明成立，我们应该有。但是，我得到 $X$ $\operatorname{var} X = npq(1-pq)$

\begin{aligned} var X & = E [var (X ∣ Y)] + var (E [X ∣ Y]) \\ = E [Y p (1 - p)] + var (p Y) \\ = n p (1 - p) + p^{2} n q (1 - q) . \end{aligned}

$\begin{aligned} \operatorname{var} X &= E[\operatorname{var}(X\mid Y)] + \operatorname{var}(E[X\mid Y])\\ &=E[Yp(1-p)] + \operatorname{var}(pY)\\ &=np(1-p) + p^2 n q (1-q). \end{aligned}$

这不等于。要看到这一点，请插入，在这种情况下和。 $npq(1-pq)$ $p=0.5,q=0.5$ $npq(1-pq)=0.1875n$ $np(1-p) + p^2 n q (1-q)=0.3125n$

我想知道是否有人可以检查我的数学，或者指向任何显示真的是勉强 Bin(n,pq) 的资源。谢谢。 $X$

3个回答

正如本指出的那样，你犯了一个代数错误，结果是正确的。这个过程称为二项式细化，如果您搜索该表达式，您会在已发表的文献中找到许多提及它的内容。该过程不仅适用于二项式随机变量，还适用于多项式、泊松和负二项式。假设我们有二项式、泊松或负二项式随机变量：

$Y_1\sim {\rm Binomial}(n,q)$
$Y_2\sim {\rm Poisson}(\lambda)$
$Y_3\sim {\rm Negative\ Binomial}(\mu,\phi)$ ，即，均值 $\mu$ 和方差 $\mu+\phi\mu^2$

我们可以将这些随机变量中的每一个视为来自随机过程的计数事件。现在假设各个事件并非全部被观察到，而是被随机截取，因此平均而言 $p$ 其中一些人通过并被观察到，而其他人则迷路了。换句话说，我们通过保留每个原始事件的概率来“稀释”随机过程 $p$ ：

$X_1|Y_1 \sim {\rm Binomial}(Y_1,p)$
$X_2|Y_2 \sim {\rm Binomial}(Y_2,p)$
$X_3|Y_3 \sim {\rm Binomial}(Y_3,p)$

产生的“细化”分布具有以下边际分布：

$X_1 \sim {\rm Binomial}(n,pq)$
$X_2 \sim {\rm Poisson}(p\lambda)$
$X_3 \sim {\rm Negative\ Binomial}(p\mu,\phi)$

效果是按因子缩小分布的期望值 $p$ 在不改变分配形式的情况下。

我自己使用的二项式细化示例是thinCountsedgeR 包 ( https://rdrr.io/bioc/edgeR/man/thinCounts.html ) 的功能，可用于生成 RNA-seq 读取计数以减少测序深度.

你的工作中有一个代数错误——因为 $\mathbb{E}(Y)=nq$ 你应该有：

\begin{aligned} V (X) & = E (V (X ∣ Y)) + V (E (X ∣ Y)) \\ = E (Y p (1 - p)) + V (p Y) \\ = p (1 - p) E (Y) + p^{2} V (Y) \\ = n q p (1 - p) + p^{2} n q (1 - q) \\ = n p q [(1 - p) + p (1 - q)] \\ = n p q (1 - p q), \end{aligned}

$\begin{align} \mathbb{V}(X) &= \mathbb{E}(\mathbb{V}(X\mid Y)) + \mathbb{V}(\mathbb{E}(X\mid Y)) \\[6pt] &= \mathbb{E}(Yp(1-p)) + \mathbb{V}(pY) \\[6pt] &= p(1-p) \mathbb{E}(Y) + p^2 \mathbb{V}(Y) \\[6pt] &= n q p(1-p) + p^2 n q (1-q) \\[6pt] &= n p q [(1-p) + p (1-q)] \\[6pt] &= n p q (1 - p q), \\[6pt] \end{align}$

匹配分布的边际方差 $\text{Bin}(n,pq)$ .

写和其中和。然后和具有指定的联合分布（是显而易见的，并且以为条件，我们将得到的总和），但显然 $Y = \sum_i B_i$ $X = \sum_i A_i B_i$ $A_i \sim \text{Bernoulli}(p)$ $B_i \sim \text{Bernoulli}(q)$ $Y$ $X$ $Y$ $Y$ $Y$ $B_i$ $A_i B_i \sim \text{Bernoulli}(pq)$ 独立。因此 $X \sim \text{Binomial}(n, pq)$ 勉强。

其它你可能感兴趣的问题

上一篇测试随机变量生成算法下一篇向下拖动公式时如何阻止excel更改范围？