估计调查中的偏差

机器算法验证 贝叶斯 估计 民意调查 偏见 常客
2022-03-21 01:09:04

假设一家公司在某个国家/地区独立地N对随机城市进行调查,估计每个城市的男性和女性比例。

例如:

  • 男性 =X1% 和女性 =(100X1)城市 1 的百分比
  • 男性 =X2% 和女性 =(100X2)城市 2 的百分比
  • 等等

现在,假设我们对整个国家的男性和女性比例有一个独立无偏的估计,即男性 =YT%,女性 =(100YT)%。

使用所有这些数据,我们如何才能更好地估计每个城市的男性和女性比例?

解决这个问题的常客或贝叶斯方法是什么?

1个回答

这是一个使用调查抽样理论的解决方案(“frequentist”解决方案)。

让我们假设整个国家的男性和女性的估计是一个好的估计(它的方差足够低)。然后可以使用校准技术(例如后分层或Deville 和 Särndal's)改进每个城市的估计值。该国男性和女性人数的估计值称为校准余量

校准将为您提供新的权重,它定义了校准后的估计量,即:

  • 也是公正的,只要您的调查中有足够数量的单位
  • 更精确(精度随着校准裕度和调查变量之间的相关性而增加,这在您的情况下可能很高)

如果整个国家的估计质量很差(方差远高于两个城市的估计),则不能用作校准余量。