我曾多次有人告诉我,当您比较一段时间内的数据时,您可以/应该对人口普查数据进行通常保留用于样本统计的测试(例如,均值差异等)。通常的说法是,这是因为每次人口普查都是“时间样本”。
我的理解是,以这种方式扩展抽样理论是不合适的。具体来说,下面的解释(从人口普查统计技术复制)很好地描述了我的观点。
当你有一个样本时,你可以使用推论统计来概括总体。当您进行人口普查时,您已经拥有整个人口的数据,因此无需一概而论。
例如,如果您使用抽样,并且组之间存在 3% 的差异,那么您必须使用推论统计来确定这 3% 的差异是真实的,还是只是由于您进行抽样时的随机机会。
但是,如果您进行了人口普查,并且各组之间存在 3% 的差异,那么,肯定会有 3% 的差异。3% 的差异不是由于抽样中的随机机会,因为您拥有整个人口的数据。但是,即使进行人口普查,您仍然需要使用自己的判断来思考为什么会有 3% 的差异(出于抽样中随机机会以外的原因),以及 3% 的差异是否大到足以具有任何实际意义为你正在做的工作。
所以基本上,只需使用描述性统计数据。相关性很好,但您只需要 r 值来显示相关性的强度,而不是与抽样中的随机机会相关的 p 值。
很多人不明白样本统计数据和人口普查统计数据之间的区别,并且会抱怨你没有正确地进行统计。我曾经有过这样的案例,我最终不得不对人口普查数据进行推论统计,只是因为人们抱怨太多以至于任何东西都没有 p 值!
如果您在人口普查中有很多缺失的数据,有时您需要一些花哨的推理统计数据来填写。我怀疑这是否适用于您,但它确实适用于美国人口普查,因为(出于某些奇怪的自由主义原因)完成人口普查在美国不是强制性的。
但是,我的问题涉及跨时间而不是组之间的比较。我得到的论点是,当您跨时间查看时,每个人口普查参数实际上是跨时间所有可能参数的单点样本。我有几个问题:
- 不同时期人口普查数据的差异不能归因于偶然性。它们必须归因于潜在环境/人口的变化,以及
- 即使“及时采样”参数是正确的,您也只能从这个“无限人口”中采样到很少的数据点——可能是你想要比较的四到五个人口普查的参数——这意味着太小以至于对生成样本统计数据毫无用处。
当然,其他人已经更正式地解决了这种情况,但我一直无法找到涵盖这种情况的材料。因此,我的问题是:
这里的任何人都可以为我指出讨论这个问题的材料的方向,或者提供对“及时采样”论点的解释,为接受对人口普查参数使用样本统计测试确实合适提供更正式的基础?