如何聚类/识别远离回归线的点

数据挖掘 聚类 线性回归
2022-02-21 21:14:18

对于许多藤蔓地块,我有每棵藤蔓的 NDVI 和叶面积值。我已经知道 NDVI 和 LA 具有很强的正相关性,正如您在这张图片中看到的那样。 在此处输入图像描述

但正如您也可以看到的,还有一些点与这个点池相去甚远。如何聚类或识别这些点?我将 Python 与 sklearn、scipy 和其他类似的库一起使用。

在此处输入图像描述

1个回答

正如评论中已经提到的,有一些方法可以检测异常值。最著名的可能是库克在回归中(或之后)的距离。本质上,您寻找具有高残差的观察结果。

这是一个简短的R 教程这是一个简短的Python 方法