是否可以训练概率模型返回多个分布?

数据挖掘 深度学习 分配 高斯 概率规划 高斯过程
2021-09-28 16:26:35

我有函数 y(x) 的非线性数据,可以说是抛物线。x的某些点有几个 y(看图片)。

在此处输入图像描述

是否可以训练一个概率模型来返回多个分布(在需要时),即多个均值和方差。例如:当我将a (x=a)提供给模型时 -> 它返回 2 个红色分布(2 个均值和 2 个方差),当我将b (x=b)提供给模型时 -> 它返回 1 个蓝色分布.

谢谢。

2个回答

该数据可以建模为一个统计过程,其中分布和参数随 x 变化。这与将其建模为典型的统计分布形成对比,后者假定在整个范围内具有相同的分布和参数。

“a”范围可以建模为双峰分布,“b”范围可以建模为单峰分布。

条件分布 Y 什么时候 X=a是双峰的。平均值在中间,这样报告是正确的(1,2,3,91,92,93 确实是 47)。

这将在某种程度上反映在非常宽的方差上。如果要对完整分布进行建模,可以考虑在许多分位数处进行分位数回归。我发现这篇关于神经网络的文章来预测多个分位数。

这种分位数回归方法将正确地表明条件中位数位于抛物线的中间,但是在分位数围绕每个模式聚集之前,您将大幅跃升至第 45 和第 55 个百分位数。