如何基于有限总体的小分层样本构建置信限?

机器算法验证 置信区间 民意调查 小样本 分层 超几何分布
2022-03-14 17:34:14

想象一家企业希望审计其交易。 它有一个汇总交易的数据库,构成人口的抽样框架。详细检查每笔交易既费时又费钱,因此在这种情况下,谨慎的标准是对总体进行抽样。

使用在该数据库中找到的特征(例如交易的金额或类型),审计师已 (a) 将总体划分为不重叠的和 (b) 随机抽样而不从每个层中替换。

假设审计的目的是估计M,检查时具有某种特征的总体交易总数;例如,它们可能不符合某些业务规则。一个希望M是小!因此,我们的数据包含每个层的三个计数:层的大小Ni,样本量ni,和观察到的不合格交易的数量xi.

有一些明显的方法可以估计每个层中不合格交易的总数i; 例如,我们可以乘以观察到的比例xi/ni按层大小Ni

M^i=xiNini.

这些的总和是一个可能的估计量M.

有一个准确、可辩护的置信限(上限或下限)对于M. 通常——至少根据我研究过的教科书——简单地估计M通过汇总的估计方差M^i(使用适当的权重)并应用正态近似。当有

  • 小样本ni,
  • 小观察计数xi(尤其是当xi=0) 或者
  • 与层大小相比,样本很大(粗略地,当ni超过约 10%Ni)。

当所有三个有问题的条件都适用于一个或多个层时,我们如何构建具有良好覆盖率的置信限?

0个回答
没有发现任何回复~