每个对数线性模型是否都有完全等效的逻辑回归?

机器算法验证 物流 相互作用 对数线性
2022-03-31 10:41:27

我正在尝试将对数线性模型拟合到调查数据中的大量变量。有一些原因可能更适合将逻辑回归拟合到该数据。一些权威人士建议这些是等效的。但是,我有一些理由对此表示怀疑。

  1. 对数线性模型同等对待所有变量,而逻辑回归要求将一个变量标识为响应变量。
  2. 在最小二乘环境中,对于 Y = a+bX + ε 与 X = c+dY + ε 的情况,通常情况下参数 d 甚至约等于 1/b。这是因为第一个方程使垂直误差最小化,而第二个方程使水平误差最小化。只有当误差围绕估计线对称时,它们才会相等。所以我担心逻辑回归也可能如此。(2) 实际上只是 (1) 的一种特定形式,即选择特定变量作为响应时,回归格式中可能存在的不对称性。

  3. 如果对数线性模型中的所有变量都涉及一个或多个交互项,我看不出逻辑回归如何等效。在逻辑回归的背景下,如何表达响应变量所涉及的交互作用?

作为对 Bill Huber 的回应,我在比 Wikipedia 更受限制的意义上使用术语对数线性模型。我指的是分类或有序计数数据的模型,以表格形式排列,其中系数是表格总数、每个因素的边际计数除以表格总数(用作概率的代理)以及各种交互项。这是 Agresti,“分类数据分析”等中使用的含义。

1个回答

答案是不'。对数线性模型比逻辑回归模型更通用。参见 Fienberg, 1980, Analysis of Cross-Classified Categorical Data, 第 6.2 节,了解如何指定对数线性模型以使其对应于逻辑回归。

实际上反过来是正确的:如果所有变量都是分类的,那么每个逻辑回归模型都对应于一些对数线性模型。