对类高斯数据的约束拟合的置信区间

机器算法验证 置信区间 曲线拟合 约束回归
2022-04-05 12:52:21

我正在使用一种仪器的数据,该仪器预计会先验地产生高斯(通常)分布数据:

G=Aexp((xμ)2σ)

数据通常是稀疏的,每个只有大约 2-3 个测量值。在这个问题中,我关注的是单个,但实际上,我们经常有分析物信号导致重叠然后同时拟合,如下所述。GGG

为了使适合我们的测量,我们使用参考信号先验地之外的所有参数。所以拟合减少到GμσA

G=AG0

然后通过最小二乘法拟合以确定A

我的主要问题是:拟合 )是什么?σAA


我最初的方法是估计作为拟合的RMSE但由于 RMSE 本质上是残差的标准差,这似乎是高估了:我想要拟合参数的置信区间。σA

在这种情况下,我可以安全地将以下教科书方程用于线性回归斜率的置信区间吗?是预测变量,是预测变量的平均值,是拟合残差,1 个拟合变量消耗了 2 个自由度,残差总和为零)xix¯ei

σA=seΣi(xix¯)2=1n2Σiei2Σi(xix¯)2

我认为“是的”:我所做的只是在拟合线性参数之前我也认为“不”,因为我不确定在这个等式中的含义 - 它是否特定于线性回归?xxix¯


为了给你一个可视化,我的数据几乎和这些模拟数据一样糟糕(但通常信号包含更多的一两个数据点):

仅适用于 2 个数据的高斯拟合

注意:我知道贝叶斯分析将是传递有关信息的更好方法,但我现在无权更改分析软件。我需要限制自己对的估计。μσσA

编辑:另一个可能排除某些解决方案的注释:我正在分析数千个没有已知真实值的批量测量。

1个回答

杰夫,
两条评论。
1)您描述的步骤对应于拟合模型: with {epsilon_i} iid,正态分布,均值为 0,方差为 sigma,即标准线性模型(假设观测值取决于未知参数 A 的线性方式),没有截距。 最小二乘估计是 其方差可以通过 如果模型有截距,就会有 \bar{x}。

Gi=AG0(xi)+ϵi


A^=ΣiGiG0(xi)ΣiG0(xi)2


se2(A^)=1n1Σiei2ΣiG0(xi)2.

2)从你所说的看来,为了反映 A 中的不确定性,一个形式为: 更好。可以拟合常数 a,将 ln(G_0(x_i)) 项作为固定偏移量,并将 a 的估计量中的不确定性转换为 A 中的不确定性。

ln(Gi)=a+ln(G0(xi))+ϵi