众所周知,频率数据中的“跳跃”很难估计。在当前的文献中,已经测试了许多用于估计这种跳跃的不同技术,并且通常具有令人满意的结果。例如, Riley, 2008是一篇关于其中一些技术的总结论文。
然而,所有这些技术都涉及“浮动”的频率数据,即数据返回到均值的意义上。我有兴趣检测的频率数据的爆发。
此类频率数据的可视化(来自Brookmeyer & Stroup, 2003的图表)将是:
现在我发现这类数据在“疾病爆发检测”文献中经常被考虑。但我根本找不到好的转换、算法或估计程序。
这可能是因为我不确定这种频率数据的名称。
我在上面展示的 Brookmeyer & Stroup 图表是“浮动”频率数据的 CUSUM 图,所以它不是数据本身。他们指出,如果 CUSUM 图超过,则会发出警报。这是有道理的,因为 CUSUM 是对均值偏差的转换。但在类型的频率数据的情况下,不能应用这种技术。
所以,我有两个问题:
- 这种类型的已知转换(例如“浮动”频率数据的 CUSUM)是什么?
- 这种类型的众所周知和广泛使用的检测算法是什么?
任何见解都受到高度赞赏。
编辑(一些直觉)
实时运行良好的简单算法可能是某种考虑均值或标准差的转换。的数据。尽管这样的转换很容易构建,但将“真正的爆发”与正常观察区分开来可能非常困难。这是因为均值和标准差。当接管某个窗口时,两者都趋于零。例如,诸如或之类的阈值将不是稳健的。