我对统计数据和置信区间领域完全陌生。所以这可能非常微不足道,甚至听起来很愚蠢。如果您能帮助我理解或指出一些可以更好地解释这一点的文献/文本/博客,我将不胜感激。
我在 CNN、福克斯新闻、Politico 等各种新闻网站上看到了他们关于 2012 年美国总统竞选的民意调查。每个机构都进行了一些民意调查并报告了一些表格的统计数据:
CNN:奥巴马的受欢迎程度是 X%,误差幅度为 +/- x1%。样本量 600。FOX:奥巴马的受欢迎程度为 Y%,误差幅度为 +/- y1%。样本量 800。XYZ:奥巴马的受欢迎程度为 Z%,误差幅度为 +/- z1%。样本大小 300。
以下是我的疑问:
我如何决定信任哪一个?它应该基于置信区间,还是我应该假设由于 Fox 的样本量更大,它的估计更可靠?置信度和样本量之间是否存在隐含关系,这样指定一个就不需要指定另一个?
我可以确定置信区间的标准差吗?如果是这样,它是始终有效还是仅对某些分布(如高斯)有效?
有没有办法可以“合并”或“组合”上述三个估计并获得我自己的估计以及置信区间?在这种情况下,我应该要求多大的样本量?
我提到 CNN/Fox 只是为了更好地解释我的例子。我无意在这里发起民主党与共和党的辩论。
请帮助我理解我提出的问题。