我有函数 y(x) 的非线性数据,可以说是抛物线。在x的某些点有几个 y(看图片)。
是否可以训练一个概率模型来返回多个分布(在需要时),即多个均值和方差。例如:当我将a (x=a)提供给模型时 -> 它返回 2 个红色分布(2 个均值和 2 个方差),当我将b (x=b)提供给模型时 -> 它返回 1 个蓝色分布.
谢谢。
该数据可以建模为一个统计过程,其中分布和参数随 x 变化。这与将其建模为典型的统计分布形成对比,后者假定在整个范围内具有相同的分布和参数。
“a”范围可以建模为双峰分布,“b”范围可以建模为单峰分布。
条件分布 是Y 什么时候 X=一个X=a是双峰的。平均值在中间,这样报告是正确的(1 , 2 , 3 , 91 , 92 , 931,2,3,91,92,93 确实是 4747)。
这将在某种程度上反映在非常宽的方差上。如果要对完整分布进行建模,可以考虑在许多分位数处进行分位数回归。我发现这篇关于神经网络的文章来预测多个分位数。
这种分位数回归方法将正确地表明条件中位数位于抛物线的中间,但是在分位数围绕每个模式聚集之前,您将大幅跃升至第 45 和第 55 个百分位数。