机器算法验证 - 来自两个 SRS 少重复项的无偏估计器 - 吾爱随笔录

的总体中抽取两个独立的随机样本：第一个是大小为的简单随机样本，第二个是大小为的简单随机样本。让集合和的两个样本中选择的所有记录减去任何重复项。因此，应该由个记录组成，其中 + ) 因为不包含重复项。 $N$ $n$ $m$ $S$ $n$ $m$ $S$ $n_s$ $n_s$ $\le ($ $m$ $n$ $S$

我正在尝试为人口总数创建一个无偏估计器，该估计器仅取决于中的记录，仅包含所有、、和。 $S$ $y_i$ $n$ $m$ $N$

我试图模仿无偏的 Horvitz Thompson 估计量 $\hat{t} = \sum_{iϵS}y_i/\pi_i$ ，其中 $\pi_i$ 是 $y_i$ 在 $S$ 中的概率。在这里，我认为人的第一个样本中选择人的第二个样本中选择 $\pi_i$ 的事件的并集概率。的情况下表达总和的上限。 $y_i$ $n$ $y_i$ $m$ $n_s$

有没有办法仅根据所有 $y_i$ 、 $n$ 、 $m$ 和 $N$ 来模仿 Horvitz Thompson 估计器？或者我应该采取不同的方法来创建无偏估计器？