从基本统计数据和一直听到“相关性不是因果关系”来看,我倾向于认为即使 X 和 Y 不是因果关系,也可以说“X 和 Y 是相关的”。例如,我通常认为冰淇淋销量和泳装销量相关是完全可以的,因为泳装销量高可能意味着冰淇淋销量高(即使泳装销量的增加不会导致冰淇淋销量的增加) )。
但是,在学习时间分析时,我对这个术语有些困惑。似乎时间序列分析师不会说冰淇淋销售与泳装销售相关,而是说冰淇淋销售与泳装销售虚假相关。未经修改的“X 与 Y 相关”似乎是为 X 实际上导致Y的情况保留的,因此可以说温度(但不是冰淇淋)与泳装销售相关。
这个对吗?我的问题是虚假相关似乎有两种含义:
- 将两个独立的随机游走相互回归,普通的统计测试会说它们是相关的,即使这两个随机游走显然在任何方面都不相关。(我对虚假相关的含义很满意,因为确实没有关系。)
- 将冰淇淋销售与泳装销售进行回归。让我感到困惑的是,这种相关性被称为虚假,因为冰淇淋销售和泳装销售之间确实存在关系,即使这种关系不是因果关系。
所以我想我的问题是:时间序列分析师是否为因果关系保留术语“(非虚假)相关性” - 所以对于时间序列分析师来说,相关性意味着暗示因果关系!- 虽然统计学家一般都可以使用“相关性”来表示任何类型的(可能是非因果关系)关系?