我听说人们在很多不同的情况和不同的方式中使用了虚假相关这个术语,这让我感到困惑。此外,虚假关系的维基百科页面指出:
“在统计学中,虚假关系或虚假相关是一种数学关系,其中两个或多个事件或变量彼此之间没有因果关系(即它们是独立的),但由于任一巧合,可能会错误地推断它们是或存在某个第三个看不见的因素”
几点观察:
从数学上讲,两个变量是独立的,对吗?
显然,如果两个变量是相关的,即使依赖是由第三个因素驱动的,这两个变量仍然不是独立的,就像 Wikipedia 文章声称的那样。那是怎么回事?
如果“虚假”相关性在统计上是显着的(或者不是巧合的结果),那有什么问题呢?我见过人们像狂暴的动物一样跳出来,嘴里冒出泡沫,尖叫着:“假的!假的!”。
我不明白他们为什么这样做——没有人声称变量之间存在因果关系。相关性可以没有因果关系存在,那么为什么将其标记为“虚假”,这相当于称其为“假”?