从 mathoverflow交叉发布我的问题以找到一些统计数据的具体帮助。
我正在研究一个生成数据的物理过程,该数据可以很好地投影到具有非负值的二维中。每个过程都有一个(投影的) -点轨迹——见下图。
样本轨迹是蓝色的,一种麻烦的轨迹是手绘的,红色的则是关注区域:
每个音轨都是独立实验的结果。多年来已经进行了 2000 万次实验,但其中只有 2000 次展示了我们绘制为轨迹的特征。我们只关心生成轨道的实验,所以我们的数据集是(大约)两千个轨道。
轨道有可能进入关注区域,我们预计大约轨道中个会这样做。估计这个数字是手头的问题:
我们如何计算任意轨道进入关注区域的可能性?
不可能足够快地进行实验以查看进入关注区域的轨道的生成频率,因此我们需要从可用数据中进行推断。
例如,我们已经拟合了值,但这不足以处理诸如绿色轨道之类的数据——似乎有必要拥有一个包含两个维度的模型。
我们已经拟合了从每条轨道到关注区域的最小距离,但我们不相信这会产生合理的结果。
1)是否有一种已知的方法可以将分布拟合到此类数据以进行外推?
-或者-
2) 有没有一种明显的方法可以使用这些数据来创建生成轨道的模型?例如,将轨道上的主成分分析用作大空间中的点,然后将分布(Pearson?)拟合到投影到这些组件上的轨道。