我经常需要制作散点图有很多 () 点。我已经尝试了不同的方法来表示这么多点,这些点可以捕捉分布,同时避免在图像中实际放置一百万个点的混乱。我已经完成了一些显而易见的事情,例如细化点,并将点的局部密度绘制为等高线或彩色图。我发现细化往往是无效的,因为我处理的分布通常呈指数峰值,所以我只是在更窄的区域遇到同样的问题,并且局部密度表示对用于获取的平滑/采样的细节很敏感密度场。
最近我一直在考虑尝试一种不同的策略,但我一直无法想出一个算法来使它工作(这就是这个问题的来源)。这种情节,我听说宇宙学家通俗地称之为“香蕉情节”,是灵感,我认为在贝叶斯分析中相当普遍:
这里的等高线显示和两个参数组合的置信区间。在这个应用程序中,生成了一个 2D 概率密度函数,因此绘图很容易。我想做类似的事情。
我想在数据集。显然这样的轮廓不是唯一的,因此需要额外的约束。我认为像最小化面积或最大化轮廓内点的平均密度之类的东西应该会产生预期的效果。有谁知道会产生这样一个轮廓的算法?我最终想使用matplotlib制作一个情节,所以如果你碰巧知道这样一个用python实现的算法,那么我会加分,但如果必须的话,我会自己实现。
对 CV.SE 上的标签不太熟悉,所以如果我遗漏了任何明显的标签,请建议/编辑它们。