一本兼顾理论和数学的好书

机器算法验证 贝叶斯 参考 最大似然 广义线性模型
2022-03-21 18:15:05

在我的学生时代和大学期间,我已经上过足够多的统计课程。我对这些概念有很好的理解,例如 CI、p 值、解释统计显着性、多重检验、相关性、简单线性回归(带最小二乘)(一般线性模型)和所有假设检验。早些时候,我大部分时间都被介绍给它,主要是在数学上。最近,我相信在Intuitive Biostatistics一书的帮助下,我对实际的概念理论有了前所未有的理解。

现在,我发现我缺乏的是对拟合模型(估计模型参数)等的理解。特别是,诸如最大似然估计、广义线性模型、推理统计的贝叶斯方法等概念对我来说总是陌生的。没有足够的示例或教程或概念上合理的示例,就像人们在简单的概率模型或 Internet 上的其他(基本)主题上找到的那样。

我是一名生物信息学家,我从事 RNA-Seq 数据的工作,这些数据处理原始读取计数以寻找基因表达(或差异基因表达)。从我的背景来看,即使我不熟悉统计模型,我也能够掌握泊松分布假设和负二项式等的原因。但是有些论文涉及广义线性模型并估计 MLE 等。我相信我有必要的背景来理解。

我想我要的是你们中的一些专家认为有用的方法和(a)书,它可以帮助我以更直观的方式掌握这些概念(不仅仅是严格的数学,而是有数学支持的理论)。由于我主要是要应用它们,我会(目前)对理解什么是什么感到满意,然后,我可以回到严格的数学证明......有人有什么建议吗?如果我要求的主题确实分散在一本书中,我不介意购买超过一本书。

非常感谢你!

2个回答

您会在Frank Harrell's Regression Modeling Strategies中找到您询问的所有非贝叶斯方法我会将贝叶斯建议留给更有知识的人(尽管我的书架上确实有Gelman、Carlin、Stern 和 Rubin,以及Gilks​​、Richardson 和 Speigelhalter)。市场上应该有一些贝叶斯生物统计学书籍。

更新: 当然,McCullach 和 Nelder (1989)是一本关于 GLM 的经典书籍。它在当时是开创性的,但坦率地说,我觉得它相当无聊。此外,它不包括后来的添加,如残差诊断、零膨胀模型或多级/分层扩展。Hardin 和 Hilbe (2007)用 Stata 中的实际示例详细介绍了其中一些较新的东西(其中 GLM 和扩展得到了很好的实现;Hardin 曾经在 Stata 公司工作。编写了许多这样的命令,并为三明治估计器)。