DBSCAN:什么是核心点?

机器算法验证 聚类 数据挖掘 数据库扫描
2022-03-26 06:23:06

我有一个关于DBSCAN的问题。

这里的点分为核心点边界点噪声

  • 如果至少 minPts 个点在它的距离 ε 内,则点 p 是核心点,并且这些点被称为可从 p 直接到达。从非核心点无法直接到达任何点。

  • 如果存在路径 p1, ..., pn 且 p1 = p 且 pn = q,则点 q 可以从 p 到达,其中每个 pi+1 都可以从 pi 直接到达(因此路径上的所有点都必须是核心点,除了 q)。

  • 从任何其他点无法到达的所有点都是异常值

考虑下图:

DBSCAN 示例

我不明白,如果一个半径内必须有4个点,或者一个点需要达到另外4个点,才能被归类为核心点。
所以考虑最右边的红点(就在字母“e”下面)。这是一个核心点。但在它的半径内只有 3 个其他点,而不是 4 个。所以半径内应该有 4 个点,包括一个点本身?
从那一点可以到达其他 3 个点。

1个回答

在数据库中,所有点都是相等的。

  • 蓝点在其附近有1 个点 - 它本身。
  • 黄色点在其附近各有2个点。
  • 红点在其附近各有4-5个点。

请注意,定义没有说“minPts other points”;但是“minPts 点”。你不能忽略你已经知道的一点(如果它有重复怎么办?)