相关系数为:
$$ r = \frac{\sum_k \frac{(x_k - \bar{x}) (y_k - \bar{y_k})}{s_x s_y}}{n-1} $$
样本均值和样本标准差对异常值很敏感。
以及,其中的机制,
$$ r = \frac{\sum_k \text{stuff}_k}{n -1} $$
有点像一个平均值,也许对变化不太敏感的那个可能会有变化。
样本均值是:
$$ \bar{x} = \frac{\sum_k x_k}{n} $$
样本标准差为:
$$ s_x = \sqrt{\frac{\sum_k (x_k - \bar{x})^2}{n -1}} $$
我想我想要
中位数:
$$ \text{中位数}[x]$$
中值绝对偏差:
$$ \text{中位数}[\lvert x - \text{中位数}[x]\rvert] $$
对于相关性:
$$ \text{Median}\left[\frac{(x -\text{Median}[x])(y-\text{Median}[y]) }{\text{Median}[\lvert x - \文本{中位数}[x]\rvert]\text{中位数}[\lvert y - \text{中位数}[y]\rvert]}\right] $$
我用一些随机数尝试了这个,但得到的结果大于 1,这似乎是错误的。请参阅以下 R 代码。
x<- c(237, 241, 251, 254, 263)
y<- c(216, 218, 227, 234, 235)
median.x <- median(x)
median.y <- median(y)
mad.x <- median(abs(x - median.x))
mad.y <- median(abs(y - median.y))
r <- median((((x - median.x) * (y - median.y)) / (mad.x * mad.y)))
print(r)
## Prints 1.125
plot(x,y)