我正在尝试对具有 5 个隐藏状态的序列数据进行建模。以每个状态为条件的观测数据是高斯的,除了一个状态,2 个高斯的混合似乎更合适。不幸的是,我正在使用的 R 包(depmix)似乎不支持(不扩展包)将 GMM 作为可能的响应分布。所以我正在考虑添加第 6 个状态的可能性,这样我就可以将这组丰富的状态中的一个解释为观察分布是上述混合中的第一个高斯的状态,而另一个解释为观察分布是第二个的状态高斯。
我错误地认为这两种方法是等价的吗?
我正在尝试对具有 5 个隐藏状态的序列数据进行建模。以每个状态为条件的观测数据是高斯的,除了一个状态,2 个高斯的混合似乎更合适。不幸的是,我正在使用的 R 包(depmix)似乎不支持(不扩展包)将 GMM 作为可能的响应分布。所以我正在考虑添加第 6 个状态的可能性,这样我就可以将这组丰富的状态中的一个解释为观察分布是上述混合中的第一个高斯的状态,而另一个解释为观察分布是第二个的状态高斯。
我错误地认为这两种方法是等价的吗?
它并不完全等效:6 态 HMM 可以对 GMM-HMM 可以建模的所有内容进行建模,但反之则不行。
假设您从 GMM-HMM 开始,和而不是的 6 状态 HMM 。
设和是 GMM 的两个分量的先验概率(然后转换为状态和)。
对于GMM-HMM 中从状态到),在 6 状态 HMM 中创建两个转换概率:
对于GMM-HMM 中到状态的每次转换),创建两个转换概率,分别从和到,两者具有相同的概率。
如果我没记错的话,得到的 6 态 HMM 等价于 GMM-HMM。
但是,相反的方法并不总是有效。想象一下,您正在启动 6 态 HMM。
假设和不相等的转移概率与和的比率不同(编辑)。您无法将这些信息带入 GMM-HMM。
简而言之,6 态 HMM 应该能够表示 GMM-HMM 所能表示的一切,甚至更多。
不,你这样想没有错。
如果,那么你也可以让独立地说
和
这是因为
请记住时间序列是独立同分布的,因此马尔可夫结构是多余的(但仍然非常好)。