在自然样条拟合附近使用 95% PI 检测异常值

机器算法验证 异常值 样条 预测区间
2022-04-07 18:50:31

请看下图: 在此处输入图像描述

我想将与其相邻点不一致的点标记为异常值。我所做的是将自然样条拟合到 1000 个观测值(图中的紫色线是拟合线)。然后我考虑拟合周围的 95% 预测区间和 99% 预测区间。我认为 99% PI 之外的任何点都是异常值。如果您查看上图,您会看到红点是被选为异常值的点。特别是查看 x = 150(x 轴)之后的异常值。这些是非常一致的,不应该被选为异常值。正如您所注意到的,PI 间隔非常窄,我认为这是因为两件事:

  1. n = 1000 很大
  2. 数据高度相关

问题是如何考虑这种相关性并获得现实的 95% PI?我需要时间序列方法吗?你的建议是什么?

非常感谢您的帮助

0个回答
没有发现任何回复~