我对皮尔逊相关系数总体值的两种类型的估计量有些困惑。
A. Fisher (1915)表明,对于二元正态总体,经验是的负偏估计量,尽管仅对于小样本量 ( ),偏倚实际上可能相当大。样本低估 ,因为它比更接近。(除非后者是或,因为那么是无偏的。)已经提出了几个几乎无偏的估计量,最好的可能是Olkin 和 Pratt (1958)更正:
B.据说在回归中观察到高估了相应的总体 R 平方。或者,通过简单的回归,是高估。基于这个事实,我看到很多文字说相对于是正偏的,这意味着绝对值:比离更远(这种说法是真的吗?)。文本说这与通过样本值高估标准偏差参数是相同的问题。有许多公式可以“调整”观察到更接近其总体参数,Wherry's (1931) 是最知名的(但不是最好的)。这种调整后的的根称为shrunken:
估计量。非常不同:第一个膨胀,第二个放气。如何调和它们?在哪里使用/报告一个以及在哪里 - 另一个?
特别是,“缩小”估计量是否也(几乎)无偏,就像“无偏”估计量一样,但仅在不同的背景下 - 在回归的不对称背景下。因为,在 OLS 回归中,我们认为一侧(预测变量)的值是固定的,样本之间没有随机误差?(在这里补充一下,回归不需要双变量正态性。)