回归中的比率,也就是关于 Kronmal 的问题

机器算法验证 回归 造型 相互作用 加权回归 比率
2022-01-26 06:09:50

最近,随机浏览的问题引发了我几年前我​​的一位教授对回归模型中比率的使用提出的副手评论的记忆。所以我开始阅读这个,最终导致了 Kronmal 1993。

我想确保我正确地解释了他关于如何建模这些的建议。

  1. 对于在依赖侧和独立侧具有相同分母的比率的模型:
    Z1Y=Z11nβ0+Z1XβX+βZ+Z1ϵ

    • 除了其他比率之外,对(反)分母变量的回归相关比率
    • (逆)分母变量的权重
  2. 对于以因变量为比率的模型:
    Y=β0+βXX+Z1nα0+ZXαX+Z1ϵ

    • 通过原始变量、分母和分母乘以原始变量回归分子[分类变量呢?]
    • 按(倒数)分母加权
  3. 对于只有自变量比率的模型: Y=β0+XβX+Z11nβZ1+WβW+Z1WβZ1W+ϵ

    • 包括分子和(反)分母作为主效应,比率作为交互项。

我在这里的解释正确吗?

1个回答

您确实应该链接到 Kronmal 论文(并解释了您的符号,该符号直接取自论文。)您对论文的阅读过于字面。具体来说,他并没有给出关于权重的建议,而是说权重可以按照通常的方式进行,因此无需讨论。它只是作为一种可能性被提及。阅读您的案例更像是示例,尤其是作为如何分析此类情况的示例。

在第 6 节中,他确实给出了一些一般性建议,我将在此引用:

本文要传达的信息是,比率变量只能在包含构成比率的变量并且还存在截距项的完整线性模型的上下文中使用。在回归分析中使用因变量或自变量的比率的常见做法可能会导致误导性推论,并且很少会产生任何收益。然而,这种做法很普遍而且根深蒂固,可能很难让一些研究人员相信他们应该放弃他们最看重的比率或指数。

这篇论文使用了 Neyman 关于出生和鹳的(虚构的)例子。要使用该示例,您可以通过 R 从 R 访问它

data(stork, package="TeachingDemos")

我会把乐趣留给读者,但一个有趣的情节是这样的coplot

内曼鹳示例的条件图