机器算法验证 - 引导样本与原始样本完全相同的机会 - 吾爱随笔录

机器算法验证采样引导程序样本量二次抽样

2022-03-14 16:47:32

只是想检查一些推理。

如果我的原始样本大小为并且我引导它，那么我的思考过程如下： $n$

$\frac{1}{n}$ 是从原始样本中提取的任何观察结果的机会。为了确保下一次抽签不是之前采样的观察，我们将样本大小限制为。因此，我们得到了这个模式： $n-1$

\frac{1}{n} \cdot \frac{1}{n - 1} \cdot \frac{1}{n - 2} \dots \frac{1}{n - (n - 1)} = \frac{1}{n!} .

$\frac{1}{n} \cdot \frac{1}{n-1} \cdot \frac{1}{n-2} \cdots \frac{1}{n-(n-1)} = \frac{1}{n!}.$

它是否正确？我偶然发现为什么它不能是。 $(\frac{1}{n})^n$

1个回答

请注意，在每个观察位置（），我们可以选择观察中的任何一个，因此有可能的重新采样（保持它们被绘制的顺序），其中是“相同的样本”（即包含所有没有重复的原始观察；这说明了我们开始时对样本进行排序的所有方式）。 $i=1, 2, ..., n$ $n$ $n^n$ $n!$ $n$

例如，对于三个观察值 a、b 和 c，您有 27 个可能的样本：

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc

其中六个包含 a、b 和 c 各一个。

所以是取回原始样本的概率。 $n!/n^n$

撇开 - 概率的快速近似：

考虑一下：

\sqrt{2 π} n^{n + \frac{1}{2}} e^{- n} \leq n! \leq e n^{n + \frac{1}{2}} e^{- n}

${\sqrt {2\pi }}\ n^{n+{\frac {1}{2}}}e^{-n}\leq n!\leq e\ n^{n+{\frac {1}{2}}}e^{-n}$

所以

\sqrt{2 π} n^{\frac{1}{2}} e^{- n} \leq n! / n^{n} \leq e n^{\frac{1}{2}} e^{- n}

${\sqrt {2\pi }}\ n^{{\frac {1}{2}}}e^{-n}\leq n!/n^n \leq e\ n^{{\frac {1}{2}}}e^{-n}$

下限是斯特林近似的常用下限（对于较大的具有较低的相对误差）。 $n$

[Gosper建议使用这将产生该概率，根据您的标准有多严格甚至的情况下都可以很好地工作。] $n! \approx \sqrt{(2n+\frac13)\,\pi}n^ne^{-n}$ $\sqrt{(2n+\frac13)\pi}\,e^{-n}$ $n=3$ $n=1$

（对评论的回应：）在给定的重新采样中没有得到特定观察的概率是，对于大的大约是。 $(1-\frac{1}{n})^n$ $n$ $e^{-1}$

其它你可能感兴趣的问题