根据单个预测计算平均值的置信区间
数据挖掘
Python
统计数据
2021-10-14 20:18:55
2个回答
好的,我们有两打具有不确定性的预测和实际点值。我仍然不确定我们是否有足够的知识来回答,所以我将概述一些要点,并希望有人可以改进这一点。快速搜索发现三个类似的 StackExchange 问题:
- 结合 13 个独立的回归似乎是最相似的——注意注释警告这可能没有意义。最佳答案建议采用抽样方法,因为结果没有封闭形式。使用正态近似值会有一个封闭的形式,但我认为你的情节表明错误不是正态的,或者你的 95% CI 太窄了。
- 结合 2——见 esp。回复讨论荟萃分析以及您是否有固定效应或随机效应模型。这可能就是您正在做的事情,在这种情况下,为该社区重新制定问题可能是最好的。
- Delta 方法——在我看来,同样的问题,但采用直接最大化方法,假设近似值成立。
一些观察表明任何简单的平均值都不会给你想要的东西,你需要非常清楚正在组合什么,以及结果将回答什么问题:
如果这些是 95% 的置信区间,那么您的错误模型过于保守。几乎所有这些都应该包括真实值(灰色虚线对角线),但只有大约 5 个。因此,任何参数组合都至少是不可靠的。但是假设您有一个带有未校准估计值的黑匣子,并且您只想知道该黑匣子的“平均值”,无论多么未经校准。
如果这些是来自众包平台的两打不相关的估计,那么“平均值”没有意义。另一方面,如果它们是人群的表现衡量标准,那么平均值就是人群在所有问题类型中的平均表现。在这种情况下:
- 第一个近似值只会平均两个点并使用它的标准偏差。(每个点都可以加权。)
- 第二次近似会将每个估计值和 CI 视为正常,并使用其中一个公式来组合正常 CI。但是请注意,似乎误差线越靠近边缘越宽。这可能需要特殊处理。
- 第三种近似:从两个分布中抽取 100 个预测样本,然后组合这 2400 个样本。(加权可以通过改变每个预测的样本量来完成。)即使分布不被假定为正态,也可以工作。
相反,如果您有来自不同输入数据的单个统计模型的两打预测,并且您想知道所有输入组合的平均预测,请不要将它们组合起来。只需运行没有指定因子的模型,然后使用该结果。
希望真正的统计学家可以提供更明确的答案。
您还可以尝试一种引导方法,在该方法中,您只适合数据点的一个子集。这个子集是通过随机选择一些数据点来创建的。通过多次重复此操作,您可以从拟合结果的分布中获取不确定性。
其它你可能感兴趣的问题
