任何人都可以报告他们使用自适应内核密度估计器的经验吗?
(有很多同义词:adaptive | variable | variable-width, KDE | histogram | interpolator ...)
可变核密度估计
说“我们在样本空间的不同区域改变核的宽度。有两种方法......”实际上,更多:某个半径内的邻居,KNN 最近邻居(K 通常是固定的),Kd 树,多重网格...
当然,没有一种方法可以做所有事情,但自适应方法看起来很有吸引力。
例如,请参阅
有限元方法中自适应 2d 网格的精美图片。
我想听听哪些对真实数据有效/哪些无效,尤其是 2d 或 3d 中 >= 100k 的分散数据点。
11 月 2 日添加:这里是“块状”密度(分段 x^2 * y^2)、最近邻估计和带斯科特因子的高斯 KDE 的图。虽然一 (1) 个示例不能证明任何事情,但它确实表明 NN 可以相当好地适应陡峭的山丘(并且,使用 KD 树,在 2d、3d 中速度很快......)