假设您有一个由 1 和 0 组成的序列。你知道。
你想检验两个假设
: 序列是且
:序列全是个子序列,但是有噪声。例如,序列可能以开始,然后有一段随机噪声(其中)。
在噪声周期之后,序列再次匹配模式。重要的是,的值可能与开始时不同。
也就是说,我们没有测试是否。我们只是在测试这个序列的“正常”状态是否是的批次,但这些批次可以从任何值开始。
另一种说法是我们允许插入“额外”位。
理想情况下,我想找到一个测试统计数据,使我能够在这种情况下拒绝空值。下面的评论中建议的一种可能的解决方案是计算序列的数量,并与您在 null 下找到序列的数量进行比较。
这是一个有趣的解决方案。我将不得不更多地考虑如何为这个统计数据构建置信区间或渐近线。
我很欣赏你的评论。
更新:在考虑了我们正在使用更多的场景之后,我想我可以安全地假设只插入这是一个简单得多的问题。
:序列是且。我们猜测它是根据我们在数据中观察到
:该序列有很多段,但额外的值会随机插入到序列中(如上创建偏移量)。
我不认为这对方法有太大的实质性改变,但意味着我们不再需要担心“噪声”序列的分布。
