用于预测多元数据的最佳理论/模型是什么?

计算科学 数据分析
2021-12-13 10:42:56

我使用软件在河流上进行污染物传播,该软件将一组参数()作为输入,并创建一个输出文件,该文件基本上是一个矩阵,其中每一行上的污染物浓度在沿河流的各个地方给定时间戳的河流。p1,p2,,pn

TIME500m1000m1500m2000m2500m...25000m2015/12/074:50:000.750.710.60.580.55...0.122015/12/074:55:000.710.700.580.560.51...0.10

我的问题是:基于一组给定的输入参数,哪些模型/理论适合用于预测最接近软件结果的输出?

另外,为了最大限度地减少错误,我需要多少对 INPUT/OUTPUT?

1个回答

关于来自第二个代码“前向”求解器的最小数据点的问题是一个非常广泛的问题。这取决于潜在现象的复杂性。

在最简单的情况下,流动是层流,污染物颗粒实际上是“无穷小”;我想你可以用 Fick 扩散(+ 质量传输,所以是对流扩散定律)或类似的东西来近似这个。然后,输出样本将遵循高斯定律,并且有来自数学统计和优化学习的结果,这些结果将此类分布的估计器的收敛速度作为样本大小的函数。

(好吧,不用太深入,可以使用马尔可夫和切比雪夫不等式: https ://en.wikipedia.org/wiki/Chebyshev%27s_inequality#Finite_samples )

在实际情况下,流动可能是湍流的,因此污染物传输的统计数据变得更加复杂。我不能轻易说,但统计估计和数值 PDE 的组合(这听起来像“不确定性量化”类型的问题)会帮助你。