想象一家企业希望审计其交易。 它有一个汇总交易的数据库,构成人口的抽样框架。详细检查每笔交易既费时又费钱,因此在这种情况下,谨慎的标准是对总体进行抽样。
使用在该数据库中找到的特征(例如交易的金额或类型),审计师已 (a) 将总体划分为不重叠的层和 (b) 随机抽样而不从每个层中替换。
假设审计的目的是估计检查时具有某种特征的总体交易总数;例如,它们可能不符合某些业务规则。一个希望是小!因此,我们的数据包含每个层的三个计数:层的大小样本量和观察到的不合格交易的数量
有一些明显的方法可以估计每个层中不合格交易的总数; 例如,我们可以乘以观察到的比例按层大小:
这些的总和是一个可能的估计量
有一个准确、可辩护的置信限(上限或下限)对于 通常——至少根据我研究过的教科书——简单地估计通过汇总的估计方差(使用适当的权重)并应用正态近似。当有
- 小样本,
- 小观察计数(尤其是当) 或者
- 与层大小相比,样本很大(粗略地,当超过约 10%)。
当所有三个有问题的条件都适用于一个或多个层时,我们如何构建具有良好覆盖率的置信限?