评估 PDF 估计方法的最佳方法

机器算法验证 假设检验 估计 密度函数 内核平滑 模型评估
2022-03-06 10:59:02

我希望测试我认为比我所见过的任何东西都更好的一些想法。我可能是错的,但我想通过更确定的观察来检验我的想法并消除我的怀疑。

我一直想做的是以下几点:

  1. 分析定义一组分布。其中一些是简单的,例如 Gaussian、uniform 或 Tophat。但其中一些必须是困难和具有挑战性的,例如辛普森一家。
  2. 基于这些分析分布实施软件,并使用它们生成一些样本。
  3. 因为分布是分析定义的,所以我已经 - 根据定义 - 知道它们的真实 PDF。这很棒。
  4. 然后我将针对上面的示例测试以下 PDF 估计方法:
    • 现有的 PDF 估计方法(如具有各种内核和带宽的 KDE)。
    • 我个人认为值得尝试的想法。
  5. 然后我将根据真实 PDF 测量估计的误差。
  6. 然后我会更好地知道哪种PDF估计方法好。

我的问题是:

  • Q1:我上面的计划有什么改进吗?
  • Q2:我发现我很难分析定义许多真正的 PDF。是否已经有许多分析定义的真实 PDF 的综合列表,其中有不同的困难(包括非常困难的),我可以在这里重复使用?
3个回答
  • A1。对我来说,这听起来像是一个明智的计划。只提几点。您需要使用不同的错误指标进行测试(Lp、KL 散度等),因为方法的执行方式会因损失函数而异。此外,您还需要测试不同数量的样本。最后,许多密度估计方法在不连续/边界附近的表现非常糟糕,因此请务必在您的集合中包含截断的 pdf。

  • A2。您是只对一维 pdf 感兴趣,还是计划测试多变量案例?至于 pdf 的基准套件,我过去曾问过一个有点相关的问题,目的是测试 MCMC 算法,但我没有找到像一套完善的 pdf 之类的东西。

如果您有足够的时间和计算资源,您可能会考虑对您的想法进行某种对抗性测试:

  • 定义一个非常灵活的 pdf 参数族(例如,许多已知 pdf 的大混合),并通过一些非凸全局优化方法 (*) 在混合的参数空间中移动,以最小化方法的性能并最​​大化其他一些最先进的密度估计方法的性能(反之亦然)。这将是对您方法的强弱的有力测试。

最后,优于所有其他方法的要求是过高的标准;必须有一些没有免费的午餐原则在起作用(任何算法都有一些潜在的先验假设,例如平滑度、长度尺度等)。为了使您的方法成为有价值的贡献,您只需要证明存在一些普遍感兴趣的制度/领域,您的算法可以更好地工作(上面的对抗性测试可以帮助您找到/定义这样的领域)。

(*) 由于您的性能指标是随机的(您将通过 Monte Carlo 抽样对其进行评估),您可能还想查看这个关于优化嘈杂、昂贵的目标函数的答案。

A2:您可以在以下一组基准测试中一维地测试您的方法

Q1:我上面的计划有什么改进吗?

那要看。混合分布残差通常是由于做了一些愚蠢的事情,比如指定一个不必要的混合分布作为开始的数据模型。因此,我自己的经验建议至少在输出中指定与模型中一样多的混合分布项。此外,混合 PDF 的输出与模型中的 PDF 不同。Mathematica 默认搜索包括具有两个项的混合分布,并且可以指定为更大的数字。

Q2:是否已经有一个完整的列表,列出了许多具有不同难度(包括非常困难的)的解析定义的真实 PDF,我可以在这里重复使用?

这是来自 Mathematica 的FindDistribution例程的列表:

Possible continuous distributions for TargetFunctions are: BetaDistribution, CauchyDistribution, ChiDistribution, ChiSquareDistribution, ExponentialDistribution, ExtremeValueDistribution, FrechetDistribution, GammaDistribution, GumbelDistribution, HalfNormalDistribution, InverseGaussianDistribution, LaplaceDistribution, LevyDistribution, LogisticDistribution, LogNormalDistribution, MaxwellDistribution, NormalDistribution, ParetoDistribution, RayleighDistribution, StudentTDistribution, UniformDistribution, WeibullDistribution , 直方图分布。

TargetFunctions 可能的离散分布有:BenfordDistribution、BinomialDistribution、BorelTannerDistribution、DiscreteUniformDistribution、GeometricDistribution、LogSeriesDistribution、NegativeBinomialDistribution、PascalDistribution、PoissonDistribution、WaringYuleDistribution、ZipfDistribution、HistogramDistribution、EmpiricalDistribution。

内部信息标准使用贝叶斯信息标准以及 TargetFunctions 的先验。