我可以这样应用隐马尔可夫模型吗?

数据挖掘 机器学习 马尔科夫过程
2022-03-05 08:27:33

我刚刚被隐马尔可夫模型弄湿了。现在我想应用它们来判断来自 ATM 的交易是否可疑。我在定义我的隐藏状态时非常困惑。

我的尝试:交易是可疑的或非可疑的。由于在分析之前我无法("this is hidden to me")判断交易是否可疑,因此我的Hidden States(Suspicious, Non-Suspicious). 这成立吗?

我最大的困惑:当我阅读有关天气示例的隐马尔可夫模型时,我是这样理解的:“天气可以是rainysunny-我的意思是在两种状态之间切换的'相同'天气”。就我transaction而言 - 一笔交易不能在可疑和非可疑之间切换。那么,我的隐藏状态是否成立

问题:我的隐藏状态是否成立?我可以这样应用 HMM 吗?请指教,谢谢。

PS:我的观察结果是位置、时间和金额,但现在我想澄清隐藏状态。

1个回答

仅当您有理由相信交易具有马尔可夫属性时,这才是隐藏马尔可夫模型的合理应用——下一个状态仅取决于当前状态,而不取决于任何先前的状态。这对于时间序列中的模型通常是有意义的(例如在天气示例中,已经在下雨的事实使得在下一个时间步骤中更有可能仍然在下雨)。当然,即使模型不完美,它也很有用。

您制定模型的方式是说 ATM 的隐藏状态(可疑/非可疑)可以预测发射或观察到的状态(位置、时间和金额)。至少对于前两个来说,这感觉有点不对劲,尤其是在涉及多个 ATM 的情况下,正如位置变量的存在所暗示的那样。我将尝试解释我认为您根据观察到的变量制定模型的方式所暗示的内容以及它可能是荒谬的,并提出一些替代方案。

首先,这似乎表明可疑/非可疑是所有 ATM 的共享状态,并且该状态以某种方式影响 ATM 的使用位置(每个隐藏状态都有从绘制位置的特定分布)。为每个 ATM 位置设置单独的模型可能更有意义。也许这已经是你想要的了。如果是这样的话,位置就不会是一个真正的观察变量。正如您所说,您可能不想考虑状态之间的交易切换,这似乎没有多大意义,也许您想考虑 ATM 切换状态。

其次,尚不清楚时间将如何成为基于可疑状态发出的随机变量。相反,时间可能更有意义,因为它可以作为您输入模型的观察结果的排序方式。

如果您确实想将所有事务组合到一个模型中,也许 SVM 作为二进制分类器会更直接。