估计附加数据产生的方差减少

数据挖掘 统计数据 算法 实验
2022-02-12 20:24:12

我想不出如何最好地命名这个,所以欢迎提出建议。标签也是如此(我没有使用我认为合适的标签的声誉)。问题是这样的:

“假设您有 N 对观测值 (x,y),并且您有一个模型,其中包含一些未知参数 B,它估计 x 和 y 之间的关系 F(x,B) -> y。现在假设您确定B 使用最小二乘法(并且隐含地,满足最小二乘的所有假设)。参数 B 本身是随机变量,每个变量都有自己的方差。有什么方法可以估计减少(或增加)由于将相同的最小二乘法应用于 N+1 对观察结果而导致的 B 的方差?”

这个问题是在实验的背景下提出的。如果每个数据点的成本为 X 美元,那么对问题的肯定回答将在很大程度上决定是否继续测试。

1个回答

我会考虑从功率分析开始:即在其他条件不变的情况下,您需要多少数据点来衡量您对特定置信水平感兴趣的效果(或参数)然后,您估算成本。