我试图重现本文的结果,但使用 python 和 HMMlearn 库而不是 matlab。本文描述了使用 HMM(隐马尔可夫模型)来预测股票价格的过程。
该论文详细介绍了使用 4 状态、5 混合高斯分布作为模型。转移概率和初始状态概率是一致的,但是排放概率是基于使用现有股票价格数据集的 k-means 算法的结果确定的。
后一部分是我卡住的地方,本文建议使用从 k-means 算法返回的每个集群的均值、方差和权重作为混合中每个成分的均值、方差和权重。据我了解,集群的平均值只是每个质心的中心,但是我不确定您将如何获得方差或权重。
TL;DR
给定一个 3 维数据集 X(形式为[[a, b, c], [d, e, f]...])并使用 k = 5(k = 混合分量数)的 k-means 算法,我将如何确定每个集群的权重和方差?