我试图更好地理解两个随机变量的协方差,并理解第一个想到它的人是如何得出统计学中常用的定义的。我去维基百科更好地理解它。从文章来看,似乎很好的候选度量或数量应具有以下属性:
- 当两个随机变量相似时,它应该有一个正号(即,当一个变量增加另一个变量时,当一个变量减小另一个变量时)。
- 当两个随机变量相反相似时,我们还希望它具有负号(即,当一个随机变量增加时,另一个随机变量趋于减少)
- 最后,当两个变量相互独立时(即它们彼此不共同变化),我们希望这个协方差量为零(或者可能非常小?)。
从上面的属性中,我们要定义. 我的第一个问题是,我并不完全清楚为什么满足这些性质。从我们拥有的属性来看,我本来希望更多类似“导数”的方程成为理想的候选者。例如,更像是“如果 X 的变化是正的,那么 Y 的变化也应该是正的”。另外,为什么从平均值中获取差异是“正确”的事情呢?
一个更切题但仍然有趣的问题是,是否有一个不同的定义可以满足这些属性并且仍然有意义和有用?我问这个是因为似乎没有人质疑我们为什么首先使用这个定义(感觉就像,它“总是这样”,在我看来,这是一个可怕的原因,它阻碍了科学和数学好奇心和思考)。公认的定义是我们可以拥有的“最佳”定义吗?
这些是我对为什么公认的定义有意义的想法(它只是一个直观的论点):
让对于变量 X 有一些差异(即它在某个时间从某个值更改为某个其他值)。类似地定义.
例如,我们可以通过以下方式计算它们是否相关:
这有点好看!对于一个实例,它满足我们想要的属性。如果它们都一起增加,那么大多数时候,上述数量应该是正的(同样,当它们相反相似时,它会是负的,因为的将有相反的符号)。
但这只能及时为我们提供一个实例所需的数量,并且由于它们是 rv,如果我们决定仅基于 1 个观察结果来建立两个变量的关系,我们可能会过度拟合。那么为什么不期待这个看到差异的“平均”产品。
这应该平均捕捉到上面定义的平均关系!但这个解释的唯一问题是,我们用什么来衡量这种差异?这似乎可以通过测量与平均值的差异来解决(出于某种原因,这是正确的做法)。
我想我对定义的主要问题是取平均值的差异。我似乎还无法为自己证明这一点。
符号的解释可以留给不同的问题,因为它似乎是一个更复杂的话题。