线性模型的导数

机器算法验证 回归 不确定
2022-03-25 05:13:36

问题
计量经济学/统计学中是否有这样的概念作为参数在线性模型中关于某些观察的导数? 通过导数我的意思是 -如果我们改变将如何改变参数 } ? bp^Xij
bp^Xijbp^Xij

动机
我在考虑这样一种情况,即我们的数据存在一些不确定性(例如调查结果),而我们有足够的资金仅在一次观察中获得精确结果,我们应该选择哪种观察?
我的直觉是我们应该选择可能改变参数最多的观察值,这相当于导数的最大值。如果有任何其他概念,请随时写下它们。

2个回答

我想这将归入回归诊断的标题下。我以前没有看到过这个精确的统计数据,但是相当接近的是DFBETA ij ,它是当省略第j观测值时回归系数i的变化除以系数i的估计标准误差。

定义这个和许多其他回归诊断(可能太多)的书是:

Belsley、DA、E. Kuh 和 RE Welsch。(1980 年)。回归诊断:识别有影响的数据和共线性的来源 纽约:威利。国际标准书号 0471691178

@onestop 指向正确的方向。Belsley、Kuh 和 Welsch 在他们书的第 24-26 页描述了这种方法。为了区分观察值(而不仅仅是其中一个属性),他们引入了权重,执行加权最小二乘法,并根据权重进行区分。

具体而言,设为设计矩阵,设为第个观测值,令为其残差,令为权重,定义(第个帽子矩阵中的对角线项)为他们计算X=Xijxiieiwihiixi(XTX)1xiT

b(wi)wi=(XTX)1xiTei[1(1wi)hi]2,

何处

b(wi)wi|wi=1=(XTX)1xiTei.

这被解释为一种“识别有影响的观察,......提供一种方法来检查回归系数对第 i 个观察的权重的轻微变化的敏感性。这个导数的大值表明观察对计算系数有很大影响。" 他们建议它可以用作 DFBETA 诊断的替代方法。(DFBETA 测量观察的变化。)影响和 DFBETA 之间的关系是 DFBETA 等于影响除以 [方程 2.1 p. 13]。bi1hi