对于许多藤蔓地块,我有每棵藤蔓的 NDVI 和叶面积值。我已经知道 NDVI 和 LA 具有很强的正相关性,正如您在这张图片中看到的那样。
但正如您也可以看到的,还有一些点与这个点池相去甚远。如何聚类或识别这些点?我将 Python 与 sklearn、scipy 和其他类似的库一起使用。
正如评论中已经提到的,有一些方法可以检测异常值。最著名的可能是库克在回归中(或之后)的距离。本质上,您寻找具有高残差的观察结果。
这是一个简短的R 教程。这是一个简短的Python 方法。