请看下图:
我想将与其相邻点不一致的点标记为异常值。我所做的是将自然样条拟合到 1000 个观测值(图中的紫色线是拟合线)。然后我考虑拟合周围的 95% 预测区间和 99% 预测区间。我认为 99% PI 之外的任何点都是异常值。如果您查看上图,您会看到红点是被选为异常值的点。特别是查看 x = 150(x 轴)之后的异常值。这些是非常一致的,不应该被选为异常值。正如您所注意到的,PI 间隔非常窄,我认为这是因为两件事:
- n = 1000 很大
- 数据高度相关
问题是如何考虑这种相关性并获得现实的 95% PI?我需要时间序列方法吗?你的建议是什么?
非常感谢您的帮助