让,让。我看到它写道:
声明:是轻微的。
有一个简单的理由:首先,个成员,然后以概率选择每个成员,从而最终以概率随机选择每个成员。那是令人满意的。
但是,如果上述声明为真的边际方差的计算与应该为真的答案不一致。如果上述声明成立,我们应该有。但是,我得到
这不等于。要看到这一点,请插入,在这种情况下和。
我想知道是否有人可以检查我的数学,或者指向任何显示真的是勉强 Bin(n,pq) 的资源。谢谢。
让,让。我看到它写道:
声明:是轻微的。
有一个简单的理由:首先,个成员,然后以概率选择每个成员,从而最终以概率随机选择每个成员。那是令人满意的。
但是,如果上述声明为真的边际方差的计算与应该为真的答案不一致。如果上述声明成立,我们应该有。但是,我得到
这不等于。要看到这一点,请插入,在这种情况下和。
我想知道是否有人可以检查我的数学,或者指向任何显示真的是勉强 Bin(n,pq) 的资源。谢谢。
正如本指出的那样,你犯了一个代数错误,结果是正确的。这个过程称为二项式细化,如果您搜索该表达式,您会在已发表的文献中找到许多提及它的内容。该过程不仅适用于二项式随机变量,还适用于多项式、泊松和负二项式。假设我们有二项式、泊松或负二项式随机变量:
我们可以将这些随机变量中的每一个视为来自随机过程的计数事件。现在假设各个事件并非全部被观察到,而是被随机截取,因此平均而言其中一些人通过并被观察到,而其他人则迷路了。换句话说,我们通过保留每个原始事件的概率来“稀释”随机过程:
产生的“细化”分布具有以下边际分布:
效果是按因子缩小分布的期望值在不改变分配形式的情况下。
我自己使用的二项式细化示例是thinCounts
edgeR 包 ( https://rdrr.io/bioc/edgeR/man/thinCounts.html ) 的功能,可用于生成 RNA-seq 读取计数以减少测序深度.
你的工作中有一个代数错误——因为你应该有:
匹配分布的边际方差.
写和其中和。然后和具有指定的联合分布(是显而易见的,并且以为条件,我们将得到的总和),但显然独立。因此勉强。