如果我有一个使用分层随机样本设计的全国调查数据,并且抽样的每个阶层(例如,州)的比例与人口比例(例如,实际州人口的比例)不同[我假设分层不是根据实际国家人口的比例进行的,而是根据其他因素进行的。即,阶层不是州],如果我想在州之间进行比较,是否需要使用权重来解释不成比例的选择?
如果您也能为此提供一个很好的参考,我将不胜感激。
预先感谢您的帮助!
如果我有一个使用分层随机样本设计的全国调查数据,并且抽样的每个阶层(例如,州)的比例与人口比例(例如,实际州人口的比例)不同[我假设分层不是根据实际国家人口的比例进行的,而是根据其他因素进行的。即,阶层不是州],如果我想在州之间进行比较,是否需要使用权重来解释不成比例的选择?
如果您也能为此提供一个很好的参考,我将不胜感激。
预先感谢您的帮助!
分层设计实际上意味着在每一层中设计单独的调查——在一个层中选择的单位独立于其他层中的所有选择。在每个层内进行总估计,然后结合起来得出整个人口的总估计:
调查中一个单元的设计权重应该只对该单元所属的层内的单元进行加权。假设您拥有设计权重,则无需修改它们。
我推荐阅读 Model Assisted Survey Sampling (Sarndel, Swenson, Wretman) 或 Practical Sampling Techniques (K Som)