x 和 y 都具有不确定性时的回归

机器算法验证 回归
2022-03-19 15:11:57

我有一组都有一些与之相关的噪声,但是这些点的基础真实值(即,如果我们可以去除噪声)之间的关系应该是的形式,其中是常数.N(xi,yi)XYy=mx+cmc

但是,由于的测量不准确,我的值都会出现不确定性。XYmc

1)如果我假设我对的测量不准确是高斯分布的 ~我如何获得最可能的和两者的不确定性/置信度。XYϵN(0,σ)(m,c)

2)如果我知道的不确定性是不同的,这样 where ~ , ~我可以得到不同的的估计和两者的不确定性/置信度。XYσxσyϵxN(0,σx)ϵyN(0,σy)(m,c)

2个回答

作为一般概念,X 中的误差问题称为测量误差

在线性回归分析中,它会导致衰减偏差,这被认为是内生性的来源之一。Measuremet error 将误差测量的右侧变量的系数缩​​小到零。它不会导致估计量的不确定性,而是导致其不一致

虽然在其他答案中提到戴明回归是二变量概念,但多元解决方案包括工具变量方法作为首选选项。

在线性回归的情况下,衰减偏差的公式是精确推导出来的,例如在这里这意味着如果您对错误的变化有所了解,您可能会估计问题的严重性并可能对其进行纠正。

在线性回归的情况下,Y 中的测量问题较少,因为线性回归假设因变量中存在随机误差。它会导致更差的预测和更高的残差方差,但不会以任何方式偏置系数。


编辑:这个问题在Hausman (2001)中直接描述


豪斯曼,杰瑞。“计量经济学分析中的错误测量变量:来自右边的问题和来自左边的问题。” 经济观点杂志 15,没有。4 (2001): 57-67。

在这两种情况下,您都想使用Deming 回归案例 1 是戴明回归的一个特例,称为正交回归,它最小化从数据点到回归线的垂直距离平方和。对于情况 2,一般情况下,您需要估计比率才能解决问题。δ=σy2/σx2