分析比率的技术

机器算法验证 造型 多重回归 广义线性模型 相互作用 混杂
2022-03-23 22:41:09

我正在寻找有关比率和比率分析的建议和评论。在我工作的领域,尤其是比率分析很普遍,但我读过一些论文表明这可能是有问题的,我在想:

Kronmal, Richard A. 1993。重新审视了虚假相关和比率标准的谬误。皇家统计学会杂志 A 系列156(3): 379-392

及相关论文。从我目前所读到的内容来看,似乎比率会产生虚假的相关性,通过原点强制回归线(这并不总是合适的),如果做得不正确,对它们进行建模可能会违反边际原则(在回归中使用比率,作者:Richard Goldstein )。但是,在某些情况下,使用比率是合理的,我想从统计学家那里得到一些关于这个话题的意见。

1个回答

我不会称观察到的相关性是虚假的,而是从这些相关性中得出的错误因果推论。比率问题属于其他类型的混杂问题。

如果你定义随机变量U=XQ&V=YQ, 在哪里X,Y, &Q是独立的,那么 U&V是相关的。这可能会误导您认为存在因果关系XY反之亦然,或从其他东西Q对他们俩。然而,简单地决定避免使用比率是没有用的。观察本质上不是比率,如果U,V, &Q是独立的,您将通过使用比率引入“虚假”相关性X=U1/Q&Y=V1/Q. 包含Q在您的分析中——重要的是要注意“缩放”Q不是一回事 — 保护您使用的任何东西;但不是来自其他混杂因素R,S,T,

Aldrich (1995), ""Correlations Genuine and Spurious in Pearson and Yule", Statistical Science , 10 , 4提供了一个有趣的历史视角。

† 请参阅在模型中包括交互作用但不包括主效应