像这样的概率图形模型有标准名称吗?

机器算法验证 时间序列 马尔科夫过程 图形模型 参考
2022-04-15 13:54:53

我有一些需要分析的数据,以及一些我想应用的先验知识。我有离散的时间点和嘈杂的连续输出x(t)我在那些时间点观察到,并想推断离散状态y(t)最有可能对应于x(t). 如果重要的话,我知道分布x(y1),,x(yn),并且只有六种可能的隐藏状态,并且有大量带注释的数据来训练模型。

如果这么简单,我认为隐马尔可夫模型和维特比算法就可以了。但我知道当时的输出ti不仅受当时隐藏状态的影响ti,但是通过之前的三个隐藏状态,像这样:

链接到模型的图片

因为连续隐藏状态之间的相关性不是因果关系,所以我没有指明图表,但如果必须的话,我可以使用向右的箭头。

无论如何,有谁知道这样的模型可能被称为什么,和/或尝试学习它的参数是否合理?这似乎很简单,我觉得以前必须有人做过,但我找不到任何东西。我认为它基本上是一个线性链条件随机场,但那些额外的边缘让我感到迷茫和困惑。

编辑:

如果更容易解析/考虑,这里有一个示例,其中当前观察到的状态取决于过去的两个,而不是四个隐藏状态:

简化模型

这是线性链 CRF 的最小扩展,但我仍然找不到类似的例子。有什么帮助吗?

1个回答

我认为您需要将图表重新转换为不同的形式。可能有不止一种方法可以做到这一点。

关于您的模型需要注意的一个非常重要的事情是,在任何给定时间,您都可以对隐藏状态做出最佳猜测。特殊之处在于,在下一个时间步,您可以更好地猜测之前的隐藏状态是什么。在每个时间步长到 4 时,您对过去隐藏状态的估计都会显着提高。

由于您有 6 个隐藏状态,因此您可以在底部情况下将其替换为代表所有可能对的 36 个状态。然后你有一个马尔可夫过程,其中转换矩阵中的大多数元素为零,因为元组状态(A,D)必须紧随其后(D,?). 现在您有 36 个输出概率分布需要考虑,这与您的原始图表相比太多了。通货膨胀的原因是我们现在允许y(ti)y(ti+1). 如果您确保您的输出概率模型不包括交互项(即它完全分解),那么您将返回您请求的模型。

对于您有 4 个重要的历史记录的情况也是如此。将其更改为单个 4 元组,您有64状态。然后确保您的输出概率模型对状态的每个元素都进行了因式分解,然后您又回到了上面的模型。

请注意,在向量隐藏状态上运行的维特比算法将在每个时间点为您提供当前 4 个状态集的估计值。如果您将其“展平”回单个系列...y(ti),y(ti+1),...那么你对每个 y 都有多个估计,他们不会同意。这是正确的,并且可以追溯到介绍中的要点,因为每一步都取决于过去的值,所以我们对过去有更多的了解,并且可以修改我们对发生的事情的估计。