如何根据先前事件的时间预测下一个事件何时发生?

机器算法验证 可能性 造型 数据挖掘 预测模型
2022-02-03 12:38:37

我是一名高中生,正在从事计算机编程项目,但除了高中统计课程之外,我在统计和建模数据方面没有很多经验,所以我有点困惑。

基本上,我有一个相当大的列表(假设它足够大,可以满足任何统计测试或测量的假设)有人决定打印文档的时间。基于此列表,我想构建某种统计模型,该模型将在给定所有先前事件时间的情况下预测下一个打印作业的最可能时间。

我已经阅读了这篇文章,但是这些回复并不能完全帮助我了解我对项目的想法。我做了一些额外的研究,发现隐马尔可夫模型可能会让我准确地做到这一点,但我找不到有关如何仅使用时间列表生成隐马尔可夫模型的链接。我还发现在列表中使用卡尔曼滤波器可能很有用,但基本上,我想从实际使用过卡尔曼滤波器的人那里获得更多关于它的信息,并在尝试某些东西并希望它有效之前了解他们的局限性和要求。

非常感谢!

2个回答

如果数据是来自一些潜在的未观察到的马尔可夫模型的随机排放,则将适用隐马尔可夫模型;我不排除这种可能性,但它似乎不是一个非常自然的模型。

我会考虑点过程,它很好地匹配您的特定数据。在预测地震(虽然我不太了解)甚至犯罪方面有大量的工作。

如果有许多不同的人在打印,而您只看到时间而不是个人身份,泊松过程可能会很好(多个独立点过程的叠加大约是泊松),尽管它必须是不均匀的(一个点的机会随时间而变化):人们在凌晨 3 点打印的可能性低于下午 3 点。

对于非均匀泊松过程模型,关键是对特定日期特定时间打印作业的机会进行良好估计。

但是,如果这些打印时间是针对教室里的学生,那可能会非常棘手,因为他们不太可能是独立的,因此泊松过程不会很好地工作。

这是关于犯罪申请的论文的链接。

基于使用多元贝叶斯扫描统计 (MBSS) 预测可能的时间可能会有所帮助。这种MBSS的优点是提高了事件检测的及时性和准确性。