格尔曼报告的“悖论”名称

机器算法验证 悖论
2022-03-07 09:18:08

在安德鲁·格尔曼(Andrew Gelman)的《红州,蓝州》一书中,他分析了这样一个事实,即特定州的富人倾向于投票给共和党人多于穷人,但富人倾向于投票给民主党人多于穷人。

这个悖论有名字吗?

在我看来,这似乎与生态悖论有关,但并不完全相同。

2个回答

它被称为红/蓝悖论,请参阅此处参考 Freakanomics 网站

不存在“生态悖论”。推理特定于分析单元以 Robinson(1950)对 1930 年美国人口普查数据的分析为例,确实:

  • 报告为移民的个人文盲的可能性略高(个人文盲和个人移民身份呈轻微正相关);r=0.12
  • 文盲率较高的州的移民率要低得多(州级文盲和州级移民身份呈中度负相关r)。r=0.53

罗宾逊使用这些和类似的关系来证明从人口(例如)之间的关系推断到个体是一种逻辑谬误,他赋予我们术语生态谬误来描述这种谬误。

然而,相反的推断——假设个人层面的关系也必须适用于人口层面——也是一个逻辑谬误……特别是原子谬误

那么这两种关系如何(r=0.12r=0.53对于国家)是真的吗?嗯......虽然移民个人可能更可能是文盲,但移民率高的州(例如纽约)拥有吸引新移民的那种服务以及经济和文化机会。巧合的是,“服务与经济和文化”机会往往出现在以识字率更高为特征的商业和工业区域经济体中,例如,在不太适合移民的农业中心地带。红色/蓝色国家与国家富裕程度的关联与红色/蓝色个人与个人富裕程度的联系提出了完全相同的问题:将一个推理水平的关系外推到另一个推理水平的逻辑谬误。

顺便说一下,罗宾逊默认个人关系才是真正重要的假设(即他只关注人口对个人的错误推理方向)本身就是一种心理学谬误,如 Diez-Roux (1998) 和 Subramanian 等人. (2009)明确。

tl; dr:统计关系特定于其数据和分析的推理水平。“'为什么有些人患有高血压?' 是一个与“为什么有些人群有很多高血压,而在另一些人群中却很少见?”的一个完全不同的问题”——Rose,1985


参考
Diez-Roux, AV (1998)。将背景带回流行病学:多层次分析中的变量和谬误。美国公共卫生杂志,88(2):216–222。

W. 罗宾逊 (1950)。生态相关性与个体行为。美国社会学评论,15(3):351-357。

罗斯,G. (1985)。患病个体和患病人群。国际流行病学杂志,14(1):32-28。

Subramanian, SV, Jones, K., Kaddour, A. 和 Krieger, N. (2009)。重温罗宾逊:个人主义和生态谬误的危险。国际流行病学杂志,38(2):342–360。