校准调查权重意味着什么?
另外,统计学中校准的其他定义是什么?我听说它在几种情况下使用过,特别是风险预测(指一个队列中预测事件的总数是否与观察到的事件数在统计上一致)。
统计学中是否存在一个宏大、统一的校准概念?
我们关于校准的 wiki 涉及到表面问题,或者可能会提出问题。
校准调查权重意味着什么?
另外,统计学中校准的其他定义是什么?我听说它在几种情况下使用过,特别是风险预测(指一个队列中预测事件的总数是否与观察到的事件数在统计上一致)。
统计学中是否存在一个宏大、统一的校准概念?
我们关于校准的 wiki 涉及到表面问题,或者可能会提出问题。
用于测量权重的“校准”一词似乎是由Deville 和 Sarndal (1992)创造的。他们在一系列使用已知人口总数的不同程序上打了伞:
其中是人口中每个单位已知的特征向量。对于一般人群,这些将是关于人口特征的人口普查数据,例如年龄、性别、种族/民族、教育、地理(地区、州、省),并且可能是收入。对于机构人口,这些变量通常与机构规模和收入有关。对于列表样本 - 无论您附加到样本中的是什么。
Deville 和 Sarndal (1992) 讨论了如何从设计权重(选择的逆概率)其中是从中抽取的样本,到校准的权重这样
即,样本在这些变量上与总体一致。他们通过优化距离函数来做到这一点
通常,正如统计学中经常出现的情况一样,引入额外的信息会渐近地改善方差,尽管可能会抛出一些问题并引入奇怪的小样本偏差。Deville 和 Sarndal (1992) 量化了这些渐近效率增益,这是他们对文献的核心贡献。
在使用辅助数据方面,调查统计是一个非常独特的分支。贝叶斯人在他们的先验中使用辅助数据。iid 常客/可能性主义者通常没有太多方法来整合辅助信息,因为所有信息都必须包含在可能性中。然而,有一个经验似然估计的分支,其中辅助信息被用于生成和/或聚合估计方程;事实上,经验似然目标函数是 Deville 和 Sarndal (1992) 考虑的目标函数案例之一。(计量经济学家应该非常恰当地嗅出并指出,自Hansen (1982)以来,他们已经知道通过广义矩量法校准统计模型的方法已有 30 多年了。. 二次损失是 Deville 和 Sarndal (1992) 中另一个自然有趣的案例。虽然它是最容易计算的,但它会产生通常被认为很奇怪的负权重。)
我听说的统计中术语“校准”的另一种用法是反向回归,其中您对感兴趣的变量的测量不准确,并且想要恢复预测变量的值(我给出的运行示例由我的一位统计学教授的马拉松选手通过骑自行车来测量路线的距离并计算自行车车轮的转数,而不是更准确的 GPS 测量——那是在 1990 年代后期,在智能手机和手持 GPS 设备出现之前。)你校准您的自行车在已建立的 1 公里路线上行驶,然后尝试骑自行车以达到 42 公里。
可能还有其他用途。不过,我不确定将它们全部倾倒在一个条目中是否特别明智。您指出因子分析是该术语的一个潜在用户,但我并不是特别清楚它是如何在那里使用的。
假设您进行了一项调查并获得了 1,000 条回复。也许您通过手机进行了调查,而老年人的手机使用率与年轻人不同。因此,您的调查对象中有 5%(N=50)是老年人,但根据美国人口普查局的数据,15% 的美国人实际上是老年人。假设受访者的年龄对于您的调查分析以及您最终发布的内容很重要。为了让您的 1,000 个回答正确推广到更现实的人群,您需要给老年人 3 倍的权重(加权 N 需要为 150),并将其他所有人的权重缩小一点(非老年人 N=950 应该有加权 N 为 850)。校准、倾斜、后分层是使您的调查数据集更接近某个官方总数的技术。
“校准”一词还有其他用途。例如,在这个 CV 线程中,Frank Harrell 在确定模型拟合的上下文中讨论了它:
首先要检查的关键是模型的校准,要么使用引导程序来纠正过度拟合,要么使用不用于模型开发或拟合的巨大独立样本。
通常,在预测建模中,模型的校准是指在训练数据上评估拟合优度(或模型准确度) ,而在测试数据上评估预测误差。