线性和逻辑回归的误差分布

机器算法验证 物流 广义线性模型
2022-03-04 14:38:32

对于连续数据,线性回归假设误差项是分布的 N(0, )Y=β1+β2X2+uσ2

1) 我们是否假设 Var(Y|x) 同样是 ~N(0, )?σ2

2)逻辑回归中的这种误差分布是什么?当数据为每个案例 1 条记录的形式时,其中“Y”为 1 或 0,是分布伯努利的误差项(即方差为 p(1-p)),并且当数据的形式为 # #of 试验的成功,是否假定为二项式(即方差为 np(1-p)),其中 p 是 Y 为 1 的概率?

1个回答

1) 如果 具有正态分布,即那么,因为不是随机变量。uN(0,σ2)Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2β1+β2X2

2)在逻辑回归中,假设误差遵循这里提到的二项分布最好写成,因为这些概率取决于,如此应用逻辑回归中所引用的。Var(Yj|Xj)=mj.E[Yj|Xj].(1E[Yj|Xj])=mjπ(Xj).(1π(Xj))Xj