机器算法验证 - x 和 y 都具有不确定性时的回归 - 吾爱随笔录 - 问答

x 和 y 都具有不确定性时的回归

机器算法验证回归

2022-03-19 15:11:57

我有一组点。和都有一些与之相关的噪声，但是这些点的基础真实值（即，如果我们可以去除噪声）之间的关系应该是的形式，其中和是常数. $N$ $(x_i,y_i)$ $X$ $Y$ $y = mx +c$ $m$ $c$

但是，由于和的测量不准确，我的和值都会出现不确定性。 $X$ $Y$ $m$ $c$

1）如果我假设我对和的测量不准确是高斯分布的 ~我如何获得最可能的和两者的不确定性/置信度。 $X$ $Y$ $\epsilon$ $N(0,\sigma)$ $(m,c)$

2）如果我知道和的不确定性是不同的，这样 where ~ , ~我可以得到不同的的估计和两者的不确定性/置信度。 $X$ $Y$ $\sigma_x \neq \sigma_y$ $\epsilon_x$ $N(0,\sigma_x)$ $\epsilon_y$ $N(0,\sigma_y)$ $(m,c)$

2个回答

作为一般概念，X 中的误差问题称为测量误差。

在线性回归分析中，它会导致衰减偏差，这被认为是内生性的来源之一。Measuremet error 将误差测量的右侧变量的系数缩小到零。它不会导致估计量的不确定性，而是导致其不一致。

虽然在其他答案中提到戴明回归是二变量概念，但多元解决方案包括工具变量方法作为首选选项。

在线性回归的情况下，衰减偏差的公式是精确推导出来的，例如在这里。这意味着如果您对错误的变化有所了解，您可能会估计问题的严重性并可能对其进行纠正。

在线性回归的情况下，Y 中的测量问题较少，因为线性回归假设因变量中存在随机误差。它会导致更差的预测和更高的残差方差，但不会以任何方式偏置系数。

编辑：这个问题在Hausman (2001)中直接描述。

豪斯曼，杰瑞。“计量经济学分析中的错误测量变量：来自右边的问题和来自左边的问题。” 经济观点杂志 15，没有。4 (2001): 57-67。

在这两种情况下，您都想使用Deming 回归。案例 1 是戴明回归的一个特例，称为正交回归，它最小化从数据点到回归线的垂直距离平方和。对于情况 2，一般情况下，您需要估计比率才能解决问题。 $\delta = \sigma^2_y / \sigma^2_x$

其它你可能感兴趣的问题

上一篇负置信区间的解释下一篇用三个变量边缘化概率