数据挖掘 - 如何获得 k-means 聚类的权重和方差？ - 吾爱随笔录

我试图重现本文的结果，但使用 python 和 HMMlearn 库而不是 matlab。本文描述了使用 HMM（隐马尔可夫模型）来预测股票价格的过程。

该论文详细介绍了使用 4 状态、5 混合高斯分布作为模型。转移概率和初始状态概率是一致的，但是排放概率是基于使用现有股票价格数据集的 k-means 算法的结果确定的。

后一部分是我卡住的地方，本文建议使用从 k-means 算法返回的每个集群的均值、方差和权重作为混合中每个成分的均值、方差和权重。据我了解，集群的平均值只是每个质心的中心，但是我不确定您将如何获得方差或权重。

TL;DR 给定一个 3 维数据集 X（形式为[[a, b, c], [d, e, f]...]）并使用 k = 5（k = 混合分量数）的 k-means 算法，我将如何确定每个集群的权重和方差？