为什么包括× _( × )Xln⁡(X)逻辑回归模型中的交互项有助于评估线性假设?

机器算法验证 回归 物流 假设
2022-03-08 15:26:36

在Andy Field 的使用 SPSS第 4 版发现统计中,建议包含自变量之间的交互项X及其对应的自然对数变换ln(X)变量以检查是否违反线性假设。这背后的统计理论是什么?

这是书中的一段话:

可以通过查看预测变量与其对数转换之间的交互项是否显着来测试该假设(Hosmer & Lemeshow,1989)。

我最近还发现这种转换称为 Box-Tidwell 转换。

1个回答

Box 和 Tidwell (1962) [1] 提出了一种用于估计单个预测变量 (IV) 变换的通用方法,并通过估计预测变量的幂变换(包括幂 0,其中 - 具有适当的缩放比例)的具体情况来工作- 对应于将日志作为限制情况)。

在这种特殊的权力转换案例中,事实证明这与回归有关Xj日志(Xj).

所以,如果你有那种非线性,其中之间的真实(条件)关系Xj是线性的Xjαj然后它可以用来检查αj1,或者确实估计α价值观。

具体来说,当回归XjXj日志(Xj)第二项的系数除以第一项的系数是一个近似估计αj-1. (这个估计可以迭代到收敛。)

如果估计αj接近 1,则几乎没有迹象表明需要进行转换。

请注意,由于产品中的两个术语Xj日志(Xj)都是函数Xj,这只是一个转换的Xj所以我不会称之为交互;它只是一个转换后的预测器。(事实上​​,即使我很想这样做,因为 日志(Xj)不包括作为预测变量我仍然不会倾向于将第二个术语描述为交互。)

[1]:Box, GEP 和 Tidwell, PW (1962),“自变量的变换”。技术计量学4,531-550