有人对一些人进行了调查,并将结果存入数据库(调查 1)。对于任何亚群(仅限男性、仅限年轻人等),每个观察都有额外的信息,这些信息给出了该亚群中人口数量的国家级估计,以及该估计的置信区间。正如预期的那样,相互排斥的子组(男性人数加上女性人数)的估计值总和给出了人口总数的估计值。
我不知道调查是如何进行的,抽样方法等。我只有数据库。来自数据库的所有估计计数都假定为对数正态分布。
其他人进行了另一项调查(调查 2)。更多的人接受了采访。这项调查并不是为了估计任何事情——它只是为了提供有关被采访者的信息。
对于整个人口以及任何子人口,调查 2 的统计数据偏少,因为并非人口中的每个人都接受了采访。通常,基于调查 1 的估计值大于来自调查 2 的计数,但情况并非总是如此。
问题:结合这两项调查的信息的最佳方式是什么?我对一个近似的解决方案很好。
如果我只有调查 1,我对子人群 A 中人数的点估计将是 E(A)。但是,从调查 2 中,我知道 A >。那么我应该计算 E(A|A > ) 吗?
这样做会导致矛盾。即,相互排斥的亚群中的估计计数总和大于整个总体的估计计数。
谢谢您的帮助。我希望这很清楚。如果不是,请询问,我会尽力解释。:-)