我一直在使用统计数据来衡量“影响”或一些类似的概念,方法如下:
首先计算给定样本的平均值,然后依次计算给定样本的平均值,不包括每个观测值。从前者中减去后者。结果是一个向量,测量样本均值因包含每个观测值而增加的量。
像这样(或多或少):
对我来说,这让人想起回归中“杠杆”的概念,但我想知道是否
- 这种特定的衡量标准已在其他地方使用过——尤其是在统计文献中。
- 这个具体的措施有一个名字
在此先感谢您的时间。
我一直在使用统计数据来衡量“影响”或一些类似的概念,方法如下:
首先计算给定样本的平均值,然后依次计算给定样本的平均值,不包括每个观测值。从前者中减去后者。结果是一个向量,测量样本均值因包含每个观测值而增加的量。
像这样(或多或少):
对我来说,这让人想起回归中“杠杆”的概念,但我想知道是否
在此先感谢您的时间。
均值是数据对常数回归的系数. 在此回归上下文中,您的统计数据是Belsley, Kuh, & Welsch, Regression Diagnostics (J Wiley & Sons, 1980)中定义的最简单的DFBETA诊断示例:
...我们首先看一下估计回归系数的变化,如果行被删除。表示用 被删除的行,这个变化很容易从公式中计算出来
在哪里
[第 12-13 页,公式 (2.1) 和 (2.2)]。
在这种情况下,设计矩阵是个经过矩阵,从哪里来. 号码是残差,
所以
它接近(如果不完全是)当地影响和/或库克的距离。
JRSS B,卷。48, No. 2, 1986, p.133-169 是经典论文。有点密集,但一个开始寻找文献的地方。