回归中潜在变量的估计效果

机器算法验证 非线性回归
2022-04-05 18:20:46

我相信自变量X1,X2影响因变量Y通过潜变量Z这样

Y=β0+β1ZZ=Logit1(β2X1+β3X2)Y=β0+β1Logit1(β2X1+β3X2)

是否可以估计β2β3, 给定Y?

1个回答

一个答案是“不”。另一个是“当然”。

为了简化符号,让λ(x)=1/(1+exp(x)),逆对数。因为λ(x)=1λ(x),

β0+β1λ(x)=(β0+β1)β1λ(x)).

因此无法区分参数(β0,β1,β2,β3)(β0+β1,β1,β2,β3).

当然

让我们规定第一个非零元素(β1,β2,β3)必须是积极的。这解决了不确定性。我们仍然需要一个错误模型。例如,如果我们假设Y(β0+β1λ(β2X2+β3X3))具有正态分布和各种Y是独立的,那么我们可以使用最小二乘法来估计参数。这个非线性优化问题没有精确的解决方案,但是用数值方法很简单。

50 个数据点及其作为曲面的拟合

此图显示使用标准正态值生成的 50 个点X1X2, 范围β=(1,2,1/2,1), iid 标准差为 1/2 的正态误差。表面显示合身,β^=(2.68,1.23,0.89,1.75)(1.45,1.23,0.89,1.75).

最小二乘是具有 iid 正态错误的最大似然。使用另一个错误分布,直接使用 MLE。您可以通过标准方式获得参数的渐近置信区间。