显然有很多滥用统计方法的方法。您是否知道在著名的学术期刊上首次作为明确的建议(例如“您应该使用这种方法来……”)发表的任何不良统计实践的例子,然后又被反复引用?
一个示例可能是逻辑或 Cox PH 回归模型 ( LINK ) 经常调用的每个预测规则的 10 个事件。
需要明确的是,我并不是指碰巧使用糟糕的统计方法的高被引论文——不幸的是,这些都是微不足道的。
显然有很多滥用统计方法的方法。您是否知道在著名的学术期刊上首次作为明确的建议(例如“您应该使用这种方法来……”)发表的任何不良统计实践的例子,然后又被反复引用?
一个示例可能是逻辑或 Cox PH 回归模型 ( LINK ) 经常调用的每个预测规则的 10 个事件。
需要明确的是,我并不是指碰巧使用糟糕的统计方法的高被引论文——不幸的是,这些都是微不足道的。
在计量经济学中,您当然可以找到一些由知名(和高技能)计量经济学家在体面的期刊上发表的传播方法的例子。我不知道有一篇理论论文,但Lalonde (1986)以指出当前使用的方法效果不佳而闻名:他将相同数据集的实验方法与观察方法进行比较,发现(因果)治疗领域存在很大差异评价。有大量文献确实宣传了这些非实验性方法,这些方法在当时已经使用过,并且在今天仍然经常使用。
随后,(我认为仍然存在)关于倾向得分匹配是否是一种可能的解决方案的争论(例如,参见此处)。
此外,关于工具变量估计存在很多争议。高被引原始论文的结论一直存在争议。这可能是与您的问题最接近的示例。Bound 和 Jaeger (1996 年以及随后的论文)质疑Angrist 和 Krueger(1991 年;根据 Google Scholar 被引用 2700 次)的著名论文的发现,该论文在应用计量经济学文献中基本确立了工具变量方法。
关于所谓简化形式估计以确定因果关系的适当性也存在很大争议,例如参见Imbens (2010)。
另一个大话题当然是关于标准误差的。也许可以找到一篇著名的论文传播 p 值。在计量经济学中,由于现有方法错误,较长时间序列的标准误差经常被错误计算(在差异设计中),请参见此处。然而,我不知道有一篇原创论文在这种情况下提出了这些方法,但我相信你会在这个领域找到一些例子。
资料来源:
Angrist、Joshua D. 和 Alan B. Keueger。“义务教育会影响上学和收入吗?” 经济学季刊 106,没有。4 (1991): 979-1014。
Bertrand、Marianne、Esther Duflo 和 Sendhil Mullainathan。“我们应该在多大程度上相信差异估计?” 经济学季刊 119, no. 1 (2004): 249-275。
Bound、John 和 David A. Jaeger。论出生季节作为工资方程工具的有效性:对 Angrist 和 Krueger 的“Dos Compulsory School Attendance Affect Scho. No. w5835 的评论”。国家经济研究局,1996 年。
德赫加,拉吉夫。“实用的倾向得分匹配:对史密斯和托德的回复。” 计量经济学杂志 125,没有。1-2 (2005): 355-364。
Imbens, Guido W. “迟到总比没有好:对 Deaton (2009) 和 Heckman 和 Urzua (2009) 的一些评论。” 经济文献杂志 48, no. 2 (2010): 399-423。
LaLonde, Robert J. “使用实验数据评估培训计划的计量经济学评估。” 美国经济评论 (1986): 604-620.*
RA Fisher,“现场实验的安排”。英国农业部杂志。33:503-513。1926 年。
根据互联网上的各种消息来源,本文是使用的起源作为任意统计检验中的显着性阈值。
......在我们可以说的水平上画一条线是很方便的:“要么治疗中有问题,要么发生了巧合,例如在 20 次试验中不超过一次。”
... 如果二十分之一的几率似乎不够高,如果我们愿意,我们可以在五十分之一(2% 点)或一百分之一(1% 点)处划定界限。就个人而言,作者更愿意将显着性的低标准设定在 5% 点,而完全忽略所有未能达到这一水平的结果。只有当一个设计合理的实验很少不能给出这种程度的意义时,一个科学事实才应该被认为是经过实验建立的。
我试一试(虽然不是那么强):
非常有用的 [Cameron, AC, & Miller, DL (2015)。集群鲁棒推理从业者指南。Journal of Human Resources, 50(2), 317-372.] // 已有 1900 次 Google 学术引用// 提供了有关标准错误聚类的适当级别的建议:
“共识是保守并避免偏见,并在可能的情况下使用更大和更多的聚合集群,直到并包括担心集群太少的程度。”
然而,[Abadie, A.、Athey, S.、Imbens, GW 和 Wooldridge, J. (2017)。什么时候应该调整聚类的标准误差?(编号 w24003)。国家经济研究局。]表明,“在过于聚合的层面上进行集群实际上是有害的”。请看后面的第1页:https ://economics.mit.edu/files/13927
也许您还可以从 Abadie 等人(2017 年)强调的两个误解开始提出更强有力的案例。