我正在尝试将对数线性模型拟合到调查数据中的大量变量。有一些原因可能更适合将逻辑回归拟合到该数据。一些权威人士建议这些是等效的。但是,我有一些理由对此表示怀疑。
- 对数线性模型同等对待所有变量,而逻辑回归要求将一个变量标识为响应变量。
在最小二乘环境中,对于 Y = a+bX + ε 与 X = c+dY + ε 的情况,通常情况下参数 d 甚至约等于 1/b。这是因为第一个方程使垂直误差最小化,而第二个方程使水平误差最小化。只有当误差围绕估计线对称时,它们才会相等。所以我担心逻辑回归也可能如此。(2) 实际上只是 (1) 的一种特定形式,即选择特定变量作为响应时,回归格式中可能存在的不对称性。
如果对数线性模型中的所有变量都涉及一个或多个交互项,我看不出逻辑回归如何等效。在逻辑回归的背景下,如何表达响应变量所涉及的交互作用?
作为对 Bill Huber 的回应,我在比 Wikipedia 更受限制的意义上使用术语对数线性模型。我指的是分类或有序计数数据的模型,以表格形式排列,其中系数是表格总数、每个因素的边际计数除以表格总数(用作概率的代理)以及各种交互项。这是 Agresti,“分类数据分析”等中使用的含义。