我正在尝试将遵循双变量分布的数据排序为 numpy histogramdd,其中每个 bin 应包含相同数量的数据点(到最近的整个样本)。
我希望某种分位数方法是必需的,并且已经尝试过scipy.stats.mstats.mquantiles,根据文档,它最多需要 2D 数据。但是,它似乎独立地获取维度,将每个维度拆分为相等的边际概率,这并没有达到二维等概率箱的预期结果。
scipy/numpy 或其他包中是否有内置方法来实现这一点(2D 或更高版本)?如果没有,是否有旨在实现这一目标的算法,我可以直接自己实现?