来自两个 SRS 少重复项的无偏估计器

机器算法验证 样本 无偏估计器
2022-04-12 13:52:31

的总体中抽取两个独立的随机样本:第一个是大小为的简单随机样本,第二个是大小为的简单随机样本。让集合的两个样本中选择的所有记录减去任何重复项。因此,应该由个记录组成,其中 + ) 因为不包含重复项。NnmSnmSnsns (mnS

我正在尝试为人口总数创建一个无偏估计器,该估计器仅取决于中的记录,仅包含所有SyinmN

我试图模仿无偏的 Horvitz Thompson 估计量t^=iϵSyi/πi,其中πiyiS中的概率。在这里,我认为\pi_i是在n的第一个样本中选择y_i的事件与在m的第二个样本中选择y_iπi 的事件的并集概率。但是,我不确定如何在不使用n_s的情况下表达总和的上限yinyimns

有没有办法仅根据所有yinmN来模仿 Horvitz Thompson 估计器?或者我应该采取不同的方法来创建无偏估计器?

2个回答

一种选择是从每个样本中导出两个独立的 HT 估计值:s1s2

t^1=is1yiπi=Nnis1yi ,

t^2=is2yiπi=Nmis2yi

然后您可以使用两个估计的平均值来推导出的另一个无偏估计:t

t^=12(t^1+t^2)=N2(1nis1yi+1mis2yi)

还有其他解决方案。

抽样的每个个体的抽样概率S

πi=nN+mNmnN2=n+mmnNN

您现在可以对总体总数应用标准 HT 估计器:

t^=iSyiπi=Nn+mmnNiSyi