我正在寻找资源(教程、教科书、网络广播等)来了解马尔可夫链和 HMM。我的背景是生物学家,我目前正在参与一个与生物信息学相关的项目。
另外,我需要什么必要的数学背景才能充分理解马尔可夫模型和 HMM?
我一直在使用谷歌四处寻找,但到目前为止我还没有找到一个好的入门教程。我敢肯定这里有人更清楚。
我正在寻找资源(教程、教科书、网络广播等)来了解马尔可夫链和 HMM。我的背景是生物学家,我目前正在参与一个与生物信息学相关的项目。
另外,我需要什么必要的数学背景才能充分理解马尔可夫模型和 HMM?
我一直在使用谷歌四处寻找,但到目前为止我还没有找到一个好的入门教程。我敢肯定这里有人更清楚。
以下是一些教程(以 PDF 格式提供):
还可以查看Bioconductor教程。
我假设您想要免费资源;否则,来自 Polanski 和 Kimmel (Springer, 2007) 的Bioinformatics提供了一个很好的概述 (§2.8-2.9) 和应用程序 (Part II)。
Oliver Cappe 等人也有一本非常好的书。al:隐马尔可夫模型中的推理。但是,它是相当理论化的,并且对应用程序非常轻。
还有另一本书在 R 中有示例,但我无法忍受 - Hidden Markov Models for Time Series。
Ps 语音识别社区也有大量关于这个主题的文献。
令人惊讶的是,没有一个答案提到关于 HMM的Rabiner 教程论文。
虽然实际实现(论文的后半部分)侧重于语音识别,但由于其清晰且呈现良好的性质,这篇论文可能是 HMM 文献中最常被引用的一篇。
它从引入马尔可夫链开始,然后转向 HMM。
对于生物信息学应用,关于 HMM 的经典文本是 Durbin、Eddy、Krough 和 Michison,“ Biological Sequence Analsysis - Probabilistic Models of Proteins and Nucleic Acids”,Cambridge University Press,1998,ISBN 0-521-62971-3。它是技术性的,但非常清晰,我发现它非常有用。
对于 MCMC,有一本 Robert 和 Casella 最近的(a 版)书,“ Introducing Monte Carlo Methods with R”,Springer,看起来不错,但我还没有机会阅读它(以 R 为例,这是一个很好的学习方法,但我需要先学习 R ;o)