有哪些有趣且写得很好的应用统计学论文?

机器算法验证 参考 应用
2022-01-25 03:38:42

有哪些描述统计应用的好论文会很有趣且内容丰富?为了清楚起见,我并不是真的在寻找描述新统计方法的论文(例如,关于最小角度回归的论文),而是描述如何解决现实世界问题的论文。

例如,一篇适合我正在寻找的论文是来自第二个交叉验证期刊俱乐部的气候论文。我有点在寻找更多的统计论文,而不是机器学习论文,但我想这是一种模糊的区别(我将 Netflix Prize 论文归类为有点边界,一篇关于情感分析的论文我不是在寻找)。

我之所以问,是因为我看到的大多数统计应用要么是您在教科书中看到的小片段,要么是与我自己的工作相关的东西,所以我想扩展一下。

4个回答

我很难看出你可能对什么论文感兴趣,所以让我试着从心理测量学文献中提出以下建议:

Borsboom, D. (2006)。心理测量学家的攻击心理测量71,425-440

修饰场景(为什么我们需要使用更好地反映心理学研究中常见的潜在假设的统计模型?),以及

Borsboom, D. (2008)。诊断系统的心理测量学观点临床心理学杂志64,1089-1108

用于诊断医学的应用视角(从 DSM-IV 中使用的是/否评估过渡到 DSM-V 中使用的“维度”方法)。我喜欢的对生物医学研究中潜在变量模型的更大评论是:

Rabe-Hesketh, S. 和 Skrondal, A. (2008)。用于医学研究的经典潜变量模型医学研究中的统计方法17(1),5-32。

以下是《皇家统计学会杂志》过去 40 年的五篇高被引论文,C 系列:应用统计学,在浏览 Web of Knowledge 搜索结果时,标题中的明确应用引起了我的注意:

在更广泛的层面上,我会推荐 Leo Breiman 在 2001 年的 ["Statistical Modeling: The Two Cultures"][1] 论文(引用 515)我知道它最近被期刊俱乐部报道,我发现它非常有趣。我已经 c&p 了摘要。

抽象的。使用统计建模从数据中得出结论有两种文化。假设数据是由给定的随机数据模型生成的。另一个使用算法模型并将数据机制视为未知。统计界一直致力于几乎独占使用数据模型。这种承诺导致了不相关的理论和有问题的结论,并使统计学家无法研究大量有趣的当前问题。算法建模,无论是在理论还是实践上,都在统计学以外的领域得到了迅速的发展。它既可以用于大型复杂数据集,也可以作为对较小数据集的数据建模的更准确和信息丰富的替代方案。如果我们作为一个领域的目标是使用数据来解决问题,

[1]: https ://doi.org/10.1214/ss/1009213726 (开放获取)

从遗传流行病学的角度来看,我现在推荐以下关于全基因组关联研究的系列论文:

  1. Cordell, HJ 和 Clayton, DG (2005)。遗传关联研究柳叶刀366, 1121-1131。
  2. Cantor, RM, Lange, K. 和 Sinsheimer, JS (2010)。优先考虑 GWAS 结果:回顾统计方法和应用建议美国人类遗传学杂志86, 6–22。
  3. Ioannidis, JPA, Thomas, G., Daly, MJ (2009)。验证、增强和改进全基因组关联信号自然评论遗传学10, 318-329。
  4. 秃头,DJ (2006)。人口关联研究的统计方法教程自然评论遗传学7, 781-791。
  5. 格林,AE 等人。(2008 年)。在认知神经科学中使用遗传数据:从成长的烦恼到真正的洞察力自然评论神经科学9, 710-720。
  6. 麦卡锡,MI 等。(2008 年)。复杂性状的全基因组关联研究:共识、不确定性和挑战自然评论遗传学9, 356-369。
  7. 精神病学 GWAS 联盟协调委员会(2009 年)。全基因组关联研究:精神疾病的历史、基本原理和前景美国精神病学杂志166(5),540-556。
  8. Sebastiani, P. 等人。(2009 年)。全基因组关联研究和复杂性状的遗传剖析美国血液学杂志84(8),504-15。
  9. 惠康信托案例控制联盟(2007 年)。对 14,000 例七种常见疾病和 3,000 名共享对照的全基因组关联研究自然447、661-678。
  10. 惠康信托案例控制联盟(2010 年)。对 16,000 例 8 种常见疾病和 3,000 名共享对照的 CNV 进行全基因组关联研究自然464、713-720。